为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

AI PM 编辑部 · 2025年06月03日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

从Instruct GPT到GPT‑4.1,语言模型在“听话”这件事上并没有线性进步。AI21 Labs 的 Yuval Belfer 通过工程视角给出答案:问题不在模型,而在我们把所有复杂性都塞进了一个提示词。真正可靠的 AI Agent,需要规划与执行引擎。

为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

从Instruct GPT到GPT‑4.1,语言模型在“听话”这件事上并没有线性进步。AI21 Labs 的 Yuval Belfer 通过工程视角给出答案:问题不在模型,而在我们把所有复杂性都塞进了一个提示词。真正可靠的 AI Agent,需要规划与执行引擎。

总结

Yuval Belfer 的核心结论并不激进,却很务实:LLM 本身并不总是问题,问题在于我们如何使用它们。他反复强调“start simple”——能用小模型就别上大模型,能加工具就别造 Agent,能用 ReAct 就先用。但当任务复杂到需要稳定性、可解释性和成功率时,规划与执行引擎不是奢侈品,而是基础设施。这或许也是下一代 AI Agent 真正拉开差距的地方。


关键词: AI Agent, 规划, 执行引擎, 大语言模型, 提示工程

事实核查备注: 视频作者:Yuval Belfer(AI21 Labs);提到的模型:Instruct GPT、GPT‑4.1、GPT‑4o、Claude 3.5 Sonnet;框架与概念:ReAct、Function Calling、MCP、规划(planning)、执行引擎;公司:OpenAI、AI21 Labs、Microsoft、Hugging Face、Google;系统示例:AI21 Maestro