95%的GenAI项目死在上线前:强化学习才是大模型进生产的秘密武器
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
这是一场长达4小时的深度访谈,但真正炸场的只有一句话:AI行业已经不需要个人英雄主义。曾在Anthropic与Gemini训练模型的姚舜宇,用自己的路径、判断与犹豫,拆解了模型能力、应用创业、组织文化与个人选择的真实现状。
当所有人都在追逐大语言模型的“最终形态”时,NVIDIA 机器人负责人 Jim Fan 给出了一个反直觉答案:真正的 End Game 不在语言里,而在物理世界。一次演讲,把机器人、世界模型和 AGI 的关系彻底讲透。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
当所有人还在为模型排行榜和参数规模上头时,这期播客抛出了一个反直觉判断:AI infra 可能已经进入“稳定期”,真正的变量开始转向应用、编码代理和激励机制。更意外的是,Token 和强化学习并不是冷门,而是下一轮竞争的暗线。
当大多数人还在讨论“多智能体怎么写Prompt”时,一位服务上千家律所的CTO抛出一个刺耳结论:真正复杂的Agent,失败不是因为模型不够强,而是因为你把一切都塞进了聊天框。这场演讲,几乎是在给整个Agent行业泼冷水。
如果你以为更强的模型、更高的分数就等于更好的系统,这个演讲会让你不太舒服。Mario Zechner 讲的不是一次成功经验,而是一次充满“slop”的构建过程:模型很强,结果却很糟。这不是 Pi 的故事,而是整个 AI 工程正在走偏的缩影。
你可能以为,大语言模型变强靠的是更多数据、更大参数。但这场演讲抛出一个反直觉结论:真正的突破,来自让模型在强化学习环境里“自由游走”。从 OpenAI o1 到可验证的推理环境,LLM 训练正在换一套底层逻辑。
a16z在这期节目里抛出一个极度反直觉的判断:AI的终极角色不是替代你,而是把你变成“一个人的公司”。但前提是,你得会走“远路”。从模型蒸馏、去中心化,到品味、验证与代理性,这期对话几乎重塑了我们理解AI工作的方式。