4B模型干翻235B巨兽:这场演讲戳破了“大模型迷信”
当所有人都在疯狂堆参数时,Snorkel 的 Kobie Crawford 做了一件反潮流的事:用强化学习,让一个 40 亿参数的小模型,在工具使用任务上击败了 2350 亿参数的“巨无霸”。更反直觉的是,这一切的训练成本不到 500 美元。
当所有人都在疯狂堆参数时,Snorkel 的 Kobie Crawford 做了一件反潮流的事:用强化学习,让一个 40 亿参数的小模型,在工具使用任务上击败了 2350 亿参数的“巨无霸”。更反直觉的是,这一切的训练成本不到 500 美元。
很多AI工程师以为,训练和部署模型就注定要在云控制台、脚本和账单之间来回横跳。但在这场演示里,RunPod的Audry Hsu做了一件反直觉的事:她几乎没“讲”云,而是直接在IDE里,把GPU算力当成本地资源用给你看。这背后,藏着AI云基础设施正在发生的一次重要转向。
如果我告诉你,一个可用的 LLM 推理 API,从零到上线,不到 5 分钟,你大概会以为这是营销话术。但在这场来自 RunPod 的现场演示里,这件事真的发生了。更重要的不是“快”,而是它背后暴露的一个行业转向:AI 开发者,正在彻底告别基础设施焦虑。
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。
当科技圈还在为模型参数、算力集群和融资规模兴奋时,教宗的一份通谕却让AI行业集体愣住:如果效率正在取代人类尊严,我们真的走对方向了吗?这期《AI Daily Brief》把Anthropic、DeepSeek、Grok的最新进展,和一场来自宗教世界的“价值拷问”放在同一张桌子上。
很多人以为,代码模型的上限取决于参数规模。但 Cursor 和 Fireworks 在这期播客里反复强调:真正决定 RL 效果的,是你能不能造出一个“模型没法作弊”的世界。Composer 2 的训练故事,几乎是对整个 AI 应用圈的一次提醒。
当所有人还在讨论“更大的模型、更贵的GPU”时,一位工程师直接给出结论:这是条正在失效的路。在这场演讲中,Adrian Bertagnoli 用真实系统和硬数据证明——不靠更强模型,靠“异构智能”,AI可以同时变得更聪明、更快、还便宜一个数量级。
当代码生成从每秒50个Token飙到1200个,真正的瓶颈不再是模型,而是人。Cerebras的Sarah Chieng在这场演讲中抛出一个反直觉观点:模型越快,开发者越要“慢”。否则,我们只是在用20倍的速度制造技术债。
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。