o1 不是更快的 GPT-4,而是第一次真正“会思考”的模型
OpenAI 悄悄放出的 o1,并不是参数更大的新模型,却让整个 AI 圈开始重新讨论“推理”这件事。它更慢、更犹豫,甚至在很多基础任务上不占优势,但它做对了一件以前模型几乎做不好的事:在回答之前,真的想了一会儿。
OpenAI 悄悄放出的 o1,并不是参数更大的新模型,却让整个 AI 圈开始重新讨论“推理”这件事。它更慢、更犹豫,甚至在很多基础任务上不占优势,但它做对了一件以前模型几乎做不好的事:在回答之前,真的想了一会儿。
ChatGPT 上线了一个“没人被正式告知”的新模型。它更聪明了吗?也许。但更重要的是:OpenAI 正在改变模型发布的规则,而这件事让从业者、研究者和开发者同时感到兴奋又不安。
如果你今天的时间有限,只记住一句话:OpenAI 可能真的要发布一个“会思考”的新模型了,但围绕它的喧嚣,比模型本身更值得警惕。Strawberry/Q*、神秘爆料账号、Sam Altman 的暧昧互动,以及与 Google 正面撞车的发布时间,让这场风暴成了 AI 圈的集体情绪测试。
Fireworks 创始人兼 CEO 林乔,曾主导 Meta 内部 PyTorch 的核心工作。她在这次访谈中回顾了一个“以为只要 6 个月、结果做了 5 年”的工程教训,并由此提出一个极具冲击力的使命:把 AI 产品的落地周期,从 5 年压缩到 5 周,甚至 5 天。
如果你还以为“最强AI一定来自闭源”,那这周可能已经过时了。Meta 发布 Llama 3.1 405B 后,Mark Zuckerberg 亲自下场,给整个行业抛出一个极具挑衅性的判断:开源 AI 不只是理想主义,而是通往未来的唯一可行路径。这篇文章,带你看清这场真正的分水岭。
OpenAI内部一个被反复否认、又反复被曝光的项目,终于有了新名字:Strawberry。它不是更聪明的聊天机器人,而是一次对“推理、规划、长期任务”的正面进攻。这篇文章带你梳理Q*的前世今生,以及它为什么可能是Agent时代真正的起点。
你以为GPT-2是遥不可及的黑盒?Andrej Karpathy用一场从零复刻的实战视频证明:124M参数的大模型,完全可以被你“亲手还原”。更反直觉的是,真正的难点不在算法,而在工程细节与性能优化。
它的名字叫 GPT‑2,却在性能上吊打 GPT‑4;它没有任何官方说明,却悄悄出现在权威榜单;连 Sam Altman 的一句暧昧表态,都让整个行业集体脑补。这不是发布会,而是一场精心酝酿的“AI 都市传说”。
苹果还没发布任何 AI 产品,但空气里的火药味已经拉满。就在 WWDC 前夕,最新消息称:苹果正重新与 OpenAI 深度接触,讨论由其为 iPhone 提供生成式 AI 能力。这不仅关乎 Siri,更暴露了苹果在 AI 时代不得不面对的残酷现实。
这是一位亲手打造AI代码助手的CTO,对“AI是否会抢走程序员工作”这一问题的冷静回答。通过Sourcegraph和Cody的实践,他分享了模型部署、上下文窗口、推理成本与工程师心理变化的真实经验。