95%的GenAI项目死在上线前:强化学习才是大模型进生产的秘密武器
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
如果你的 AI 还在用一套固定 Benchmark 证明“我很强”,那你已经落后了。Comet ML 的 Vincent Koc 在这场演讲里抛出一个让全场不安的判断:不是模型不够好,而是我们评测 AI 的方式,已经跟不上它进化的速度。
大多数 AI Agent 不是“变笨”,而是被后端基础设施活活拖死的。Eric Allam 在这场演讲里抛出一个反直觉结论:传统三十年的无状态后端范式,正在系统性地阻碍 Agent 变得长期、可靠、可恢复。这篇文章讲清两条关键路线,以及为什么 Snapshot 正在反超 Replay。
很多人还在幻想:给大模型一个完美 Prompt,就能一次生成“神级结果”。但 Granola 的工程团队在台上直接泼了盆冷水:你不能 one shot 它。这段分享把 AI 产品工程里最不体面的真相摊开讲清楚——而且全是实战换来的。
文本转语音不再是“把字念出来”那么简单。Mistral 的 Samuel Humeau 直接抛出一个行业级判断:今天最强的 TTS,正在被重构成“像大语言模型一样”的系统,而且这一变化,正是实时语音 Agent 爆发的前提。
当所有产品都在往聊天框里挤时,Luke Harries却在台上泼了一盆冷水:纯聊天的AI,不够未来。真正的拐点,是给Agent一副“会听、会打断、会共情”的声音。这不是炫技,而是一次产品形态的升级。
当大多数公司还在纠结“要不要用 AI”,Airbnb 已经悄悄把 60% 的代码交给了 AI 写。但 Brian Chesky 在这期访谈里抛出的真正炸点,并不是效率提升,而是:AI 正在重塑“创始人模式”、消费者产品形态,以及下一代设计师的生存方式。
曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。
你以为Agent不聪明,是模型不够强?Leonie Monigatti在这场工作坊里抛出一个反直觉结论:Context Engineering里,真正决定成败的不是Prompt,而是Search。更残酷的是,80%的问题都出在这里。
大多数人还在教 AI 怎么多写点代码时,Michael Arnaldi 做了一件更狠的事:先给 AI 立规矩。这场关于 Vibe Engineering 的工作坊,核心不是更聪明的模型,而是如何用“Effect + 规则”让 AI Agent 不犯低级错、持续产出可维护代码。