从物理学家到AI先锋:Jared Kaplan谈规模化与通向人类级人工智能的路径

AI PM 编辑部 · 2025年07月29日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

本文深度解读Anthropic联合创始人Jared Kaplan在Y Combinator的演讲,揭示AI规模化背后的科学洞见、技术趋势,以及他从理论物理转向AI的个人故事。你将看到AI训练的核心机制、行业变革的独特视角,以及未来人类与AI协作的可能场景。

从物理学家到AI先锋:Jared Kaplan谈规模化与通向人类级人工智能的路径

本文深度解读Anthropic联合创始人Jared Kaplan在Y Combinator的演讲,揭示AI规模化背后的科学洞见、技术趋势,以及他从理论物理转向AI的个人故事。你将看到AI训练的核心机制、行业变革的独特视角,以及未来人类与AI协作的可能场景。

物理学家的视角:从科幻梦想到AI前沿

Jared Kaplan的AI之路并非传统技术创业者的轨迹,而是源于对宇宙本质的好奇。他坦言:“我之所以选择物理,是因为我妈妈是科幻作家,我想知道能否造出超光速飞船。”在学术界,他曾涉足粒子物理、宇宙学、弦理论,却逐渐感到进展缓慢、难以满足对快速突破的渴望。转折点来自身边朋友的提醒——AI正在成为重大领域。最初他对AI持怀疑态度,“SVMs没什么好激动的”,但随着深度学习崛起和与Anthropic创始团队的交流,他被说服投身AI研究。这个跨界故事不仅展现了科学家对“最大趋势”的敏锐洞察,也为后续的规模化理论奠定了基础。

规模化定律:AI进步的物理学式预测

在AI模型训练中,Kaplan强调了两大核心阶段:预训练和强化学习。预训练让模型学习人类文本的关联规律,强化学习则通过人类反馈优化模型行为。他用物理学家的“傻问题”推动了行业突破:“数据到底要多大?模型变大究竟提升多少性能?”结果令人震惊——无论是数据量、算力还是模型规模,性能提升都遵循极为精确的规模化定律,类似物理或天文学中的自然规律。Kaplan指出:“这些趋势覆盖了许多数量级,意味着AI会以可预测方式持续变强。”不仅预训练如此,强化学习也显示出类似的线性提升,正如早期研究者在棋类游戏Hex中的ELO评分实验所揭示。这种“拧螺丝式”进步,成为AI行业持续突破的底层驱动力,而非某一代研究者的灵光一现。

能力扩展:AI模型如何突破任务边界

Kaplan用两个维度描述AI能力的扩展:一是灵活性——AI能否像人一样处理多种模态和任务;二是任务时间跨度——AI能否完成需要数小时、数天甚至数月的复杂任务。他引用Meter的研究:“AI模型能处理的任务长度每7个月翻一倍。”这意味着,未来AI不仅能解决短时问题,还能承担跨越数年的人类组织级任务。Claude 4等新一代模型已具备存储和检索记忆的能力,能在超长上下文窗口中持续推进复杂项目。Kaplan预言:“也许不久后,AI能在几天内完成理论物理界50年才能达成的成果。”这种能力的跃迁,正在重塑科研、工程和企业运作的基本方式。

AI模型的“人性化”进化:组织知识、记忆与监督

要实现广义上的人类级AI,Kaplan认为关键在于三点:组织知识、记忆和监督。组织知识让AI能像资深员工一样理解企业、政府的运作逻辑;记忆则让AI在长周期任务中积累和调用经验;监督能力则帮助AI在模糊、复杂任务中获得更细致的奖励信号,比如“写好笑的段子”或“有品味的研究”。他透露:“我们已在Claude 4中初步实现了记忆功能,未来会更重视这些能力。”此外,AI向多模态(文本、图像、视频、机器人)和复杂任务进军,仍然依赖规模化带来的持续提升。Kaplan强调:“训练AI做越来越复杂的任务,是未来几年规模化继续带来红利的主战场。”

AI与人类协作的未来:从“协同”到“全自动化”

在实际应用层面,Kaplan观察到AI正从“协同助手”向“端到端自动化”转变。过去,AI如GitHub Copilot常作为“副驾驶”,需要人类最后把关;但近期YC创业公司已开始用AI替代完整工作流。Kaplan认为:“有些任务70%正确就能用,有些则需99.9%才可部署。”他看好人机协作的前景,尤其在科研领域:“AI在预训练阶段吸收了全人类的知识,能跨领域整合信息,发现单一专家难以察觉的洞见。”但他也提醒,最前沿任务仍需人类参与,AI的“判断力”与“创造力”尚未完全分离,人类在“管理AI、校验结果”方面将扮演重要角色。

总结

Jared Kaplan用物理学家的视角,为AI规模化和能力扩展提供了罕见的科学洞见。他的故事提醒我们,跨界思考和“傻问题”往往能推动行业突破。规模化定律让AI进步变得可预测,而组织知识、记忆和监督则是通向人类级AI的关键。对于创业者和研究者来说,敢于在AI尚未“完美”时实验、集成和创新,将是抓住未来红利的关键。AI与人类的协作模式正在重塑各行各业,理解并高效利用这些新工具,将决定你在未来科技浪潮中的位置。


关键词: 规模化定律, AI模型训练, 组织知识, 记忆, 人机协作, Claude 4, Anthropic, 大语言模型, 强化学习, 预训练

事实核查备注: Jared Kaplan(Anthropic联合创始人);Dario Amodei(相关人物);产品:Claude 4、Claude 3.5 Sonnet、GitHub Copilot、GPT-3、ChatGPT;公司:Anthropic、Y Combinator;技术名词:规模化定律、预训练、强化学习、人类反馈强化学习、多模态、组织知识、记忆、监督、上下文窗口、AI Agent、ELO评分、Meter研究、端到端自动化;关键数字:任务长度每7个月翻倍;案例:Hex棋类游戏ELO评分实验、Claude 4记忆功能、AI在药物发现/科研中的应用。