OpenAI内部曝光:92%工程师在用的Codex,正在重塑“写代码”这件事
如果你还把 Codex 当成“更聪明的代码补全”,那你已经落后一个时代了。在这场官方公开视频里,OpenAI 首次系统性展示:他们如何把 Codex 当成真正的“AI同事”,并用它把写代码、审代码、跑测试的方式彻底改掉。
如果你还把 Codex 当成“更聪明的代码补全”,那你已经落后一个时代了。在这场官方公开视频里,OpenAI 首次系统性展示:他们如何把 Codex 当成真正的“AI同事”,并用它把写代码、审代码、跑测试的方式彻底改掉。
如果我告诉你,今天最前沿的 AI 评测方法,正在全面否定我们过去十年用过的所有 benchmark,你可能会愣住。OpenAI 邀请 Arc Prize 基金会公布的新一代 AGI 测试,核心结论只有一句话:静态考试,根本测不出真正的智能。
很多人以为模型好不好,取决于准不准。但 OpenAI 在这场分享里抛出一个更锋利的观点:真正决定用户信任的,是 AI 的“风格”。而且,这不是美学问题,而是一门正在被系统研究的科学。
这场来自 OpenAI 的 AMA 看似随意,却意外揭开了企业级 AI 最难的一层:不是模型不够强,而是你是否敢对结果负责。几位创始人用“翻车经历”和现场问答,讲清了 AI Agent 从 Demo 到规模化的真实门槛。
大多数人盯着 Sora、ImageGen、Codex 的“效果”,但 OpenAI 在这支视频里展示的,是更狠的一件事:他们正在重写创意生产的工作流程本身。从分镜、协作到工具衔接,创作不再是一锤一锤敲出来的。
如果你以为模型分数越来越高,就等于能直接上生产,那这场OpenAI的分享会让你清醒。强化学习研究员Tel在台上直说:我们被“好看但没用”的评测骗了很久。这次,他们把评测拉进真实世界。
在这场 OpenAI Dev Day 上,最让人意外的不是模型参数或新 API,而是旧金山市长亲自站台,讲清楚一件事:AI 已经开始直接介入城市运转。从报修、外勤,到实时语音识别,旧金山正在成为 AI 落地最激进、也最现实的试验场。
这不是一场发布会,而是一次罕见的“坦白局”。Jony Ive第一次公开承认:离开苹果后,他和团队其实不知道终点在哪,直到ChatGPT出现。Sam Altman也揭开了一个更大的信号——人类与计算机的关系,可能真的要彻底变了。
如果你以为这只是一场例行的开发者更新,那你可能会错过关键信号:模型价格直接砍掉80%,推理所需的Token被明确点名要“更少”,以及一个反复被强调的目标——把AI真正装进每个人的口袋。这场 Developer State Of The Union,比技术更新更重要的是方向转弯。
很多人以为 Figma Make 只是“在设计工具里加点 AI”。但这场 Edu 工作坊透露的信号更激进:设计不再从画布开始,而是从“意图”和“对话”开始。更关键的是,它让一批原本做不到的交互,第一次变得现实。