从评测到智能体:OpenAI如何打磨下一代模型
这期RedpointAI播客邀请了参与GPT‑4.1研发的OpenAI成员Michelle Pokris,围绕模型评测、微调、RFT发布以及AI Agent现状展开。她分享了OpenAI内部如何选择“值得攻克的评测”,以及为什么智能体和个性化将成为未来模型的重要分水岭。
这期RedpointAI播客邀请了参与GPT‑4.1研发的OpenAI成员Michelle Pokris,围绕模型评测、微调、RFT发布以及AI Agent现状展开。她分享了OpenAI内部如何选择“值得攻克的评测”,以及为什么智能体和个性化将成为未来模型的重要分水岭。
在经历漫长的法律与舆论拉锯后,OpenAI正式放弃向完全营利性公司转型的计划。本篇文章梳理这一决定背后的真实动因、与埃隆·马斯克的冲突焦点,以及这种“非营利控股营利公司”的结构,对AI产业与投资者意味着什么。
基于The AI Daily Brief解读的OpenAI《7 Lessons for Enterprise AI》,本文系统梳理企业落地AI的七条关键经验。从评估机制、产品重构到组织与开发者赋能,解释为什么决定成败的往往不是模型本身,而是方法与节奏。
在这期 No Priors 播客中,OpenAI 研究员 Eric Mitchell 与 Brandon McKinzie 罕见地系统讲述了 O3 推理模型的设计动机与未来方向。与其把 O3 看成一次简单的模型升级,不如把它理解为:大模型正在从“生成答案”,走向“理解任务、选择工具、完成复杂目标”的关键转折。
OpenAI研究员Karina Nguyen回顾了过去数年AI研究的两次关键扩展范式转变,并结合ChatGPT与Claude等产品经验,分享了智能体(AI Agent)如何从“工具”走向“协作者”,以及这些变化对产品设计与人机协作方式的深远影响。
一个看似玩笑的“百万美元SaaS”,背后却藏着当下最值得AI从业者抄作业的一整套打法:一天上线、异步任务不掉线、支付即积分、代码全开源。这不是炫技,而是一次极度现实的创业演示。
一纸意外的总统行政令,把AI教育推上美国国家战略高度;与此同时,OpenAI正以收入预测、产品扩展和开源模型布局,重塑全球AI产业格局。本文串联政策、教育与产业三条线索,解读这场正在加速的AI人才与技术竞赛。
AI Agent 的定价,远不只是“一个月收多少钱”的商业问题,而是决定它们会被当作软件采购,还是数字员工雇佣的关键分水岭。通过 Windsurf 发起的价格战、YC 与创业者的真实案例,以及多种定价框架的碰撞,这期《AI Daily Brief》揭示了一个正在重塑 AI 商业模式与公司组织形态的核心问题。
这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。
这场由 Vercel AI SDK 团队成员 Nico 主讲的 Masterclass,不只是一次 API 教程,而是完整展示了如何用统一接口、工具调用和结构化输出,逐步搭建一个“深度研究型 AI Agent”。从最基础的 generateText,到递归式研究代理,视频给出了清晰、可复用的工程路径。