从聊天机器人到真正代理:强化学习在AI Agent中的角色
Morgan Stanley 机器学习研究员 Will Brown 通过一个真实项目故事,解释了为什么仅靠更大的模型无法催生真正的 AI Agent,以及强化学习如何成为连接模型、工具与环境的关键工程方法。
Morgan Stanley 机器学习研究员 Will Brown 通过一个真实项目故事,解释了为什么仅靠更大的模型无法催生真正的 AI Agent,以及强化学习如何成为连接模型、工具与环境的关键工程方法。
Anthropic完成35亿美元E轮融资,但这笔钱的真正含义不在规模,而在方向。一位投资人直言其价值在于“让每个软件工程师效率提升10倍”。这期视频揭示了:在模型同质化时代,Anthropic如何意外地在软件工程领域建立罕见护城河。
Y Combinator 合伙人围绕 Andrej Karpathy 提出的“Vibe Coding”展开讨论,揭示了一种正在成为主流的编程方式:AI 大规模生成代码,人类工程师的重心转向品味、产品判断和调试能力。这不是一时潮流,而是软件工程角色的根本变化。
这期《The AI Daily Brief》揭示了一个正在加速成形的现实:人工智能已成为中美地缘政治竞争的核心战场。视频不仅讲述了政策与资本的变化,更通过DeepSeek的技术突破,展示了AI成本曲线、开源路线和软实力竞争如何重塑全球格局。
一组来自Stripe的真实营收数据,首次量化了AI应用创业的爆发速度,显示其成长曲线远超2018年的SaaS巅峰。同时,Meta在产品、资本和地缘政治上的连环动作,勾勒出AI竞争从应用层蔓延到基础设施与国家战略的新阶段。
OpenAI 发布 GPT‑4.5,本以为是“最强大脑”,结果却成了“高情商选手”。它更会聊天、更懂情绪,却未必更会写代码。这一次升级,不只是一款模型的变化,而是 OpenAI 对 AI 路线的一次明确表态。
如果你还以为“做一个App”至少需要会写代码,那你已经落后了。Riley Brown 用 Claude 3.7 Sonnet 在 Cursor 里,从零开始、几乎不碰代码,在 25 分钟内做出了一个可用的 AI 应用。这不是教学视频,而是一次对“软件开发门槛”的正面爆破。
这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。
一边是前OpenAI CTO Mira Murati高调成立Thinking Machines Labs,却几乎不透露具体产品;另一边是曾被寄予厚望的AI硬件Humane Pin在一年内宣告失败。视频通过这两个对比鲜明的故事,揭示了当下AI创业中理想、资本与现实之间的张力。
Google 发布的 AI Co-Scientist 不只是一个科研辅助工具,更像是一张多智能体系统的未来蓝图。它展示了 AI 不靠“更聪明的模型”,而是通过分工协作、竞赛进化的方式,开始真正参与科学发现,并已在药物再利用等真实实验中得到验证。