o1 不是更快的 GPT-4,而是第一次真正“会思考”的模型
OpenAI 悄悄放出的 o1,并不是参数更大的新模型,却让整个 AI 圈开始重新讨论“推理”这件事。它更慢、更犹豫,甚至在很多基础任务上不占优势,但它做对了一件以前模型几乎做不好的事:在回答之前,真的想了一会儿。
OpenAI 悄悄放出的 o1,并不是参数更大的新模型,却让整个 AI 圈开始重新讨论“推理”这件事。它更慢、更犹豫,甚至在很多基础任务上不占优势,但它做对了一件以前模型几乎做不好的事:在回答之前,真的想了一会儿。
传了大半年的 OpenAI「Strawberry」终于要来了,但第一批体验者的反馈却异常克制:它会“先想 20 秒再回答”,答案却只好一点点。这不是一次简单的模型升级,而可能是 OpenAI 在竞争压力下的一次战略试探。
OpenAI 刚刚发布了 o1,一个会在回答前“思考 10–20 秒”的模型。它不追求秒回,而是用推理碾压复杂问题:数学、代码、科研、法律。更重要的是,这可能意味着大模型 scaling 的游戏规则,正在被彻底改写。
当所有人还在追问“Strawberry 到底是什么”时,OpenAI已经悄悄把真正的赌注压在了一个新名字上:Orion。这不仅是 GPT-4 的继任者,更可能决定 OpenAI 能否继续领跑生成式 AI 这场残酷竞赛。
这期RedpointAI播客深入讨论了Snowflake在AI时代的独特定位:不是追逐最大模型,而是把AI真正嵌入数据平台。从Cortex、多步推理到企业级落地经验,这是一套围绕“数据在先”的AI方法论。
Elon Musk 这次真的把桌子掀了。Grok-2 不只在榜单上压过 GPT-4 Turbo 和 Claude 3.5,更在图像生成和内容限制上“彻底放飞”。当 OpenAI 还在用模糊更新说明安抚用户时,Grok 正用另一套逻辑重写竞争规则。
如果你今天的时间有限,只记住一句话:OpenAI 可能真的要发布一个“会思考”的新模型了,但围绕它的喧嚣,比模型本身更值得警惕。Strawberry/Q*、神秘爆料账号、Sam Altman 的暧昧互动,以及与 Google 正面撞车的发布时间,让这场风暴成了 AI 圈的集体情绪测试。
Fireworks 创始人兼 CEO 林乔,曾主导 Meta 内部 PyTorch 的核心工作。她在这次访谈中回顾了一个“以为只要 6 个月、结果做了 5 年”的工程教训,并由此提出一个极具冲击力的使命:把 AI 产品的落地周期,从 5 年压缩到 5 周,甚至 5 天。
一个名为“Anonymous Chatbot”的模型悄悄出现在竞技场,却迅速点燃了整个 AI 圈。它像 GPT-4,却又明显更会“动脑子”。更关键的是,它出现的时机,正好踩在 OpenAI 内部传闻、价格骤降和产品路线转向的交汇点上。
一天之内,纳斯达克跌4%,英伟达一度跌近8%,科技股集体跳水。所有人都在问:AI泡沫破了吗?但《AI Daily Brief》给出的答案更残酷——真正触发市场恐慌的,并不是AI失灵,而是AI供应链正在暴露它最脆弱的一环。