2026年不会是更强模型之年,而是AI Harness全面上位的一年
如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。
如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。
当所有人都在讨论如何“把 AI 做得更聪明”时,incident.io 的创始工程师却踩中了一个更残酷的现实:真正让 AI 产品崩溃的,从来不是模型能力,而是你根本不知道它为什么会这么回答。这场演讲讲的不是炫技,而是 AI 工程化里最容易被忽视、却最致命的一环。
如果你以为大模型的进步只靠算力和数据,这期对话会让你改观。Anthropic 内部第一位提示工程师现身说法,讲清楚 Claude 的“记忆”“性格”与产品节奏,背后是一套与主流完全不同的构建逻辑。
如果你觉得2026年的AI行业已经进入“稳定期”,这期TBPN会把你直接拉回现实:一边是Figma业绩爆炸、审美成了新护城河;另一边是提示工程被集体嫌弃、AI生成“莫奈”钓翻全网。更狠的是,真正赚钱的AI公司,可能正在你最看不上的地方出现。
如果说 DALL·E 只是“能画”,那 OpenAI 最新一代图像模型已经开始“能干活”了。在最新一期 OpenAI Podcast 中,研究员和产品负责人罕见地同时承认:这是一次范式跃迁,而不是常规升级。为什么他们敢用“文艺复兴”来形容?这期播客给出了非常具体的答案。
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
如果你的 AI 还在用一套固定 Benchmark 证明“我很强”,那你已经落后了。Comet ML 的 Vincent Koc 在这场演讲里抛出一个让全场不安的判断:不是模型不够好,而是我们评测 AI 的方式,已经跟不上它进化的速度。
Manus为什么能在发布后迅速引爆市场、候补名单破百万、邀请码被炒到高价?答案不在模型参数,而在一次临时决定的产品视频、一个“让AI自己动手”的设计理念,以及一套完全不同于传统软件的产品方法论。
你以为Agent不聪明,是模型不够强?Leonie Monigatti在这场工作坊里抛出一个反直觉结论:Context Engineering里,真正决定成败的不是Prompt,而是Search。更残酷的是,80%的问题都出在这里。
如果你还以为写应用要从脚手架、框架和配置开始,这个视频会直接把你拉回现实:现在,只要一句话,AI 就能把整个应用写完、跑起来,甚至帮你部署上线。Riley Brown 用一次次演示告诉你,编程的重心已经彻底变了。