Karpathy 最新反思:Vibe Coding 之后,真正的战场叫 Agentic Engineering

AI PM 编辑部 · 2026年04月29日 · 54 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在纠结 Prompt 怎么写得更“优雅”,那你可能已经落后了。Andrej Karpathy 在这场分享里,把注意力从“怎么和模型聊天”,推到了一个更硬核的问题:当 LLM 变成一种新型计算机,我们到底该如何工程化它?从 Vibe Coding 到 Agentic Engineering,这不是概念升级,而是整个工作方式的转向。

Karpathy 最新反思:Vibe Coding 之后,真正的战场叫 Agentic Engineering

如果你还在纠结 Prompt 怎么写得更“优雅”,那你可能已经落后了。Andrej Karpathy 在这场分享里,把注意力从“怎么和模型聊天”,推到了一个更硬核的问题:当 LLM 变成一种新型计算机,我们到底该如何工程化它?从 Vibe Coding 到 Agentic Engineering,这不是概念升级,而是整个工作方式的转向。

一句“Vibe Coding”,其实是在承认工程的失控

去年 Karpathy 抛出“Vibe Coding”这个词时,很多人只记住了表面的轻松:跟着感觉写代码、让模型补全、反复试错。但在这次对话中,他更像是在复盘这件事的“后遗症”。Vibe Coding 的流行,本质上是因为 LLM 的能力跃迁太快,快到我们来不及建立稳定的方法论,只能先用感觉顶上。问题在于,这种方式一旦规模化,就会暴露出不可维护、不可验证、不可预测的工程风险。Karpathy 并没有否定 Vibe Coding 的价值,相反,他把它放在了一个更清晰的位置:它是探索期的工具,而不是长期的工程答案。

把 LLM 当“新计算机”,思路才真正打开

Karpathy 多次强调,把大语言模型看成“会说话的 API”是低估了它的潜力。他更愿意用“新型计算机”来形容 LLM:一种接口极其不稳定、但能力分布非常奇特的计算系统。这种计算机不擅长精确算术,却擅长语义压缩与重组;不保证一致性,却能在复杂空间中给出惊人的启发式答案。这个视角非常关键,因为一旦你接受它是“计算机”,你就会自然地问:它的编程范式是什么?它的输入输出如何约束?它的错误模型是什么?这些问题,直接把讨论从 Prompt 技巧,拉到了系统设计层面。

Jagged Intelligence:聪明但不均匀,才是常态

在对话中反复出现的一个词是“jagged intelligence”。Karpathy 用它来形容 LLM 的一种反直觉特性:模型在某些任务上表现得像专家,在另一些极其相似的任务上却犯低级错误。这不是 bug,而是结构性特征。理解这一点,会直接改变你对“可靠性”的期待。你不应该指望模型天然给出稳定答案,而是要围绕这种不均匀性去设计流程,比如通过分解任务、外部校验、或者多路径尝试来对冲风险。这也是他后面谈到 agent 设计时反复回到的基础前提。

Verifiability 才是工程分水岭,而不是模型大小

当讨论从模型能力转向系统时,一个绕不开的关键词是 verifiability。Karpathy 非常直接地指出:可验证性不会“自动”从 LLM 里长出来。你不能指望模型自己证明自己是对的。真正的工程挑战在于,如何把任务拆解到可以被外部世界验证的程度——不管是通过规则、测试、还是其他系统。这一点,几乎决定了一个 AI 系统能否进入生产环境。模型再强,如果输出不可验证,就只能停留在 demo 阶段。

从工具到 Agent,人类价值正在悄悄移动

当对话进入 agent 时,Karpathy 给出了一个非常形象的类比:传感器和执行器。Agent 不只是“会想”,而是能感知环境、采取行动、再感知反馈的闭环系统。在这样的系统里,人类的价值不再是写每一行指令,而是决定目标、设计约束、选择评估标准。换句话说,越是 agent 化,越考验人类对问题结构的理解能力,而不是操作细节。这也是他对“未来更有价值的人类技能”的回答核心:抽象、判断与系统思维。

总结

这场分享最重要的信号不是某个新名词,而是重心的整体右移:从模型能力,转向工程方法;从灵感驱动,转向可验证系统。如果你是 AI 从业者,现在值得问自己的不是“我会不会用最新模型”,而是“我设计的系统,是否尊重了 LLM 的不均匀智能特性”。真正的机会,正在 Agentic Engineering 这条更难、但更可复用的路上。


关键词: Andrej Karpathy, Vibe Coding, Agentic Engineering, 大语言模型, Jagged Intelligence

事实核查备注: 需要核查:1)Vibe Coding 一词的首次提出时间是否为去年;2)Karpathy 关于 LLM 是“新计算机”的原话表述;3)Jagged Intelligence 的具体定义是否在视频中被明确阐述;4)关于 verifiability 不会自动从 LLM 中产生的原始表述。