OpenAI Deep Research:一个AI如何学会像研究员一样上网
Isa Fulford首次系统讲述了OpenAI Deep Research的诞生过程:从一个“临时拼出来”的Demo,到基于强化学习和工具训练的研究型AI Agent。它揭示了OpenAI如何把推理模型真正带入现实世界任务。
Isa Fulford首次系统讲述了OpenAI Deep Research的诞生过程:从一个“临时拼出来”的Demo,到基于强化学习和工具训练的研究型AI Agent。它揭示了OpenAI如何把推理模型真正带入现实世界任务。
OpenAI研究员Dan Roberts用一次极具想象力的演讲,解释了为什么“推理”正在成为AI下一阶段的核心扩展维度。从test-time compute到强化学习主导训练,再到“9年内发现广义相对论”的大胆预测,这场分享揭示了通往AGI的一条非共识路径。
从微软、谷歌的真实代码比例,到OpenAI一次“性格失控”的回滚,再到Duolingo宣布全面AI优先,这期视频揭示了一个关键信号:生成式AI已不再是工具,而是在重塑组织、工程记忆和工作的基本假设。
这是一场关于终极野心的对话:从强化学习到多模态模型,Max Jaderberg讲述Isomorphic Labs如何在AlphaFold之后,试图把AI真正变成药物设计的通用引擎。
这期《AI Daily Brief》把看似分散的新闻串成了一条清晰主线:AI不再只是技术竞争,而是正在快速演变为地缘政治、产业政策和资本博弈的交汇点。从美国可能封禁DeepSeek,到英伟达在中美之间的艰难周旋,再到AGI创业公司被疯狂追逐,这些事件共同勾勒出2025年AI世界的真实张力。
这期No Priors播客首次系统讲述了OpenAI Deep Research的起源与设计取舍:为什么不把Agent做成“点按钮的机器人”,而是优先解决信息综合?以及强化学习如何在真实产品中学会规划、搜索与自我约束。
最新研究显示,AI Agent 能独立完成的任务复杂度,正在以远超预期的速度提升。从“每7个月翻倍”到“每4个月翻倍”,时间尺度的急剧压缩,可能意味着一场由 AI 自我加速引发的历史性拐点正在逼近。
在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。
在AI Agent被热烈追捧的当下,Sayash Kapoor给出了一次“泼冷水式”的演讲:Agent并没有我们想象中那么可靠。通过法律、科研和产品落地的真实失败案例,他指出问题不在模型能力,而在评估方法与可靠性工程。
Arc Institute 创始人之一 Patrick Hsu 分享了他如何用进化理论训练生成式生物模型 EVO,并试图把生物学变成可被调用、组合和验证的“应用商店”。这不仅是模型能力的跃迁,更可能重塑药物研发和生命科学的工作方式。