OpenAI DevDay 放出 o1:不是更快的模型,而是会“反复想错再想对”的模型
如果你还在用“更大模型=更聪明”理解 AI,这场 DevDay 可能会颠覆你。OpenAI 公布的 o1,不靠更快输出,而是靠“愿意思考、敢于试错”。它在最难的数学和代码题上碾压 GPT-4o,但代价是更慢、更贵。这不是一次升级,而是一次范式切换。
如果你还在用“更大模型=更聪明”理解 AI,这场 DevDay 可能会颠覆你。OpenAI 公布的 o1,不靠更快输出,而是靠“愿意思考、敢于试错”。它在最难的数学和代码题上碾压 GPT-4o,但代价是更慢、更贵。这不是一次升级,而是一次范式切换。
如果你还把模型升级理解为“更聪明一点”,那你已经落后了。Dev Day Holiday Edition 第9天,OpenAI几乎没有谈AGI,却用一连串开发者级更新给出了更残酷的答案:真正的竞争,已经从模型能力,转向谁更快把AI变成系统、产品和现金流。
OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级,而是一次关于“推理能力如何定价、为谁而生”的重要实验,揭示了AI从通用助手走向研究级工具的分水岭。
OpenAI 在“12 Days of OpenAI”第二天抛出一个狠招:不是更大的模型,而是一种新训练方式,让 o1-mini 在特定任务上干翻 o1。本质不是微调升级,而是把 OpenAI 内部的“强化学习秘密武器”交到开发者手里。
在纽约时报DealBook峰会上,Sam Altman给出了一个出人意料的判断:AGI可能比大多数人想象中更快到来,但对现实世界的冲击却更慢。他同时披露了ChatGPT的惊人增长数据、OpenAI对“AGI”的定义变化,以及与马斯克、微软和国防工业之间的微妙关系。
OpenAI在“12 Days of OpenAI”第一天就放了个大招:o1正式版上线,同时推出每月200美元的ChatGPT Pro。更炸的是,他们第一次公开承认——这个模型会“先思考,再回答”,而这正在悄悄改变AI推理、速度和可靠性的天花板。
很多人还在纠结提示词工程,但真正拉开AI应用差距的,其实是RAG。这门由 Mckay Wrigley 讲授的课程,用一个完整真实项目证明:不懂RAG,你的AI永远只是在“表演智能”。
这期《AI Daily Brief》串联了四个看似分散却高度相关的信号:顶级银行CEO对3.5天工作制的判断、微软Recall引发的“全景监控”争议、Rabbit R1的Agent实验,以及中国研究者在推理模型上的新突破。它们共同指向一个问题:当AI能力指数级提升,我们是否准备好重写工作、隐私与技术演进的默认规则?
这期《The AI Daily Brief》围绕一个尖锐问题展开:在规模化训练遇到瓶颈后,大语言模型是否还能继续进化?视频从“LLM停滞论”讲起,深入讨论了测试时计算、合成数据、自我演化模型,以及中国推理模型带来的意外冲击。
DeepMind 的 AlphaProof 团队在 No Priors 节目中首次系统讲述了他们如何将 AlphaZero 的思想迁移到数学证明领域。本文提炼了对“数学作为搜索空间”的关键洞见、测试时强化学习的突破,以及这一系统对 AI 推理能力边界的真实启示。