Karpathy 最新反思：Vibe Coding 之后，真正的战场叫 Agentic Engineering

AI PM 编辑部 · 2026年04月29日 · 54 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在纠结 Prompt 怎么写得更“优雅”，那你可能已经落后了。Andrej Karpathy 在这场分享里，把注意力从“怎么和模型聊天”，推到了一个更硬核的问题：当 LLM 变成一种新型计算机，我们到底该如何工程化它？从 Vibe Coding 到 Agentic Engineering，这不是概念升级，而是整个工作方式的转向。

Karpathy 最新反思：Vibe Coding 之后，真正的战场叫 Agentic Engineering

如果你还在纠结 Prompt 怎么写得更“优雅”，那你可能已经落后了。Andrej Karpathy 在这场分享里，把注意力从“怎么和模型聊天”，推到了一个更硬核的问题：当 LLM 变成一种新型计算机，我们到底该如何工程化它？从 Vibe Coding 到 Agentic Engineering，这不是概念升级，而是整个工作方式的转向。

一句“Vibe Coding”，其实是在承认工程的失控

去年 Karpathy 抛出“Vibe Coding”这个词时，很多人只记住了表面的轻松：跟着感觉写代码、让模型补全、反复试错。但在这次对话中，他更像是在复盘这件事的“后遗症”。Vibe Coding 的流行，本质上是因为 LLM 的能力跃迁太快，快到我们来不及建立稳定的方法论，只能先用感觉顶上。问题在于，这种方式一旦规模化，就会暴露出不可维护、不可验证、不可预测的工程风险。Karpathy 并没有否定 Vibe Coding 的价值，相反，他把它放在了一个更清晰的位置：它是探索期的工具，而不是长期的工程答案。

把 LLM 当“新计算机”，思路才真正打开

Karpathy 多次强调，把大语言模型看成“会说话的 API”是低估了它的潜力。他更愿意用“新型计算机”来形容 LLM：一种接口极其不稳定、但能力分布非常奇特的计算系统。这种计算机不擅长精确算术，却擅长语义压缩与重组；不保证一致性，却能在复杂空间中给出惊人的启发式答案。这个视角非常关键，因为一旦你接受它是“计算机”，你就会自然地问：它的编程范式是什么？它的输入输出如何约束？它的错误模型是什么？这些问题，直接把讨论从 Prompt 技巧，拉到了系统设计层面。

Jagged Intelligence：聪明但不均匀，才是常态

在对话中反复出现的一个词是“jagged intelligence”。Karpathy 用它来形容 LLM 的一种反直觉特性：模型在某些任务上表现得像专家，在另一些极其相似的任务上却犯低级错误。这不是 bug，而是结构性特征。理解这一点，会直接改变你对“可靠性”的期待。你不应该指望模型天然给出稳定答案，而是要围绕这种不均匀性去设计流程，比如通过分解任务、外部校验、或者多路径尝试来对冲风险。这也是他后面谈到 agent 设计时反复回到的基础前提。

Verifiability 才是工程分水岭，而不是模型大小

当讨论从模型能力转向系统时，一个绕不开的关键词是 verifiability。Karpathy 非常直接地指出：可验证性不会“自动”从 LLM 里长出来。你不能指望模型自己证明自己是对的。真正的工程挑战在于，如何把任务拆解到可以被外部世界验证的程度——不管是通过规则、测试、还是其他系统。这一点，几乎决定了一个 AI 系统能否进入生产环境。模型再强，如果输出不可验证，就只能停留在 demo 阶段。

从工具到 Agent，人类价值正在悄悄移动

当对话进入 agent 时，Karpathy 给出了一个非常形象的类比：传感器和执行器。Agent 不只是“会想”，而是能感知环境、采取行动、再感知反馈的闭环系统。在这样的系统里，人类的价值不再是写每一行指令，而是决定目标、设计约束、选择评估标准。换句话说，越是 agent 化，越考验人类对问题结构的理解能力，而不是操作细节。这也是他对“未来更有价值的人类技能”的回答核心：抽象、判断与系统思维。

总结

这场分享最重要的信号不是某个新名词，而是重心的整体右移：从模型能力，转向工程方法；从灵感驱动，转向可验证系统。如果你是 AI 从业者，现在值得问自己的不是“我会不会用最新模型”，而是“我设计的系统，是否尊重了 LLM 的不均匀智能特性”。真正的机会，正在 Agentic Engineering 这条更难、但更可复用的路上。

关键词： Andrej Karpathy， Vibe Coding， Agentic Engineering，大语言模型， Jagged Intelligence

事实核查备注：需要核查：1）Vibe Coding 一词的首次提出时间是否为去年；2）Karpathy 关于 LLM 是“新计算机”的原话表述；3）Jagged Intelligence 的具体定义是否在视频中被明确阐述；4）关于 verifiability 不会自动从 LLM 中产生的原始表述。

返回文章列表