Anthropic的代理构建方法论:什么时候该用Agent,什么时候不该

AI PM 编辑部 · 2025年04月04日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

Anthropic 的 Barry Zhang 用一次极其克制的演讲,拆解了“有效 Agent”真正难的地方:不是能力不够,而是人们用错了地方、把系统设计得过于复杂。本文还原他关于 Agent 演进路径、使用边界与设计心法的核心洞见。

Anthropic的代理构建方法论:什么时候该用Agent,什么时候不该

Anthropic 的 Barry Zhang 用一次极其克制的演讲,拆解了“有效 Agent”真正难的地方:不是能力不够,而是人们用错了地方、把系统设计得过于复杂。本文还原他关于 Agent 演进路径、使用边界与设计心法的核心洞见。

从“像魔法一样的功能”到真正的 Agent,我们是怎么走到今天的

理解 Agent 之前,先要理解它并不是突然出现的。Barry 在一开始就回顾了团队自己的演进路径:最早,大家做的是总结、分类、抽取这类“一个模型调用就能解决”的功能。“两三年前这些东西看起来像魔法,现在已经是 table stakes(入场券)了。”

随着产品复杂度提升,单次模型调用开始不够用,工程师们开始编排多个模型调用,用预定义的控制流完成任务。这类系统的核心目标很务实:用更多的 token 和延迟,换取更稳定、更可控的效果。Barry 给了它们一个明确的名字——workflows(工作流),并强调这是“agentic systems 的起点”。

真正的 Agent 则迈出了关键一步:它们可以根据环境反馈,自主决定下一步怎么走,而不是严格沿着人类预设的路径执行。也正因为这种自主性,Agent 开始在生产环境中承担更复杂、也更有价值的任务。但代价同样明显:成本、延迟,以及出错后的后果,都会同步放大。这种张力,贯穿了整场演讲。

第一原则:不要什么都用 Agent,这是一个反直觉但重要的结论

“Don't build agents for everything.” 这是 Barry 抛出的第一个、也是最重要的观点。听起来像是给 Agent 热潮泼冷水,但背后其实是非常工程化的判断。

在 Anthropic 看来,Agent 是用来“规模化复杂且高价值任务”的工具,而不是每个功能的自动升级版。如果一个任务的决策树可以被完整、清晰地画出来,那最优解往往不是 Agent,而是把这棵树显式写出来,然后逐个节点优化。这种方式不仅更便宜,也给你更多控制权。

什么时候才值得上 Agent?Barry 给出了一份朴素但实用的 checklist。第一是任务复杂度:Agent 在高度模糊、无法穷举路径的问题空间里表现最好。第二是任务价值:探索本身会消耗大量 token,如果任务带来的收益不够高,这笔账根本算不过来。这个判断标准,直接戳中了很多团队“为了用 Agent 而用 Agent”的误区。

为什么“写代码”是一个好 Agent 用例

为了让判断标准不停留在抽象层面,Barry 用“编码”作为正面例子,展示 checklist 如何落地。

从设计文档到一个可合并的 PR,这个过程天然就充满不确定性:需求理解、架构选择、具体实现、调试修复,每一步都有大量分叉路径,几乎不可能用静态决策树覆盖。这正是 Agent 擅长的环境。

更重要的是,成功的编码 Agent 并不是简单地产出一段代码,而是在多轮尝试中不断修正方向。这种探索虽然昂贵,但单次成功所带来的价值也足够高,能够覆盖成本。Barry 特别强调,他们看到的优秀编码 Agent,都不是一开始就“很聪明”,而是被允许在安全边界内不断试错。

第二与第三原则:保持简单,并且学会“像 Agent 一样思考”

在确认了合适用例之后,第二个原则才登场:“keep it simple”。Barry 花了大量时间强调,Agent 系统失败,往往不是模型不行,而是系统设计一开始就过度复杂。

他的建议非常克制:先把最核心的几个组成部分跑通,观察真实行为,再谈优化。不要一开始就叠加记忆、反思、多 Agent 协作等高级机制,否则你根本不知道问题出在哪一层。

最后一个原则则更像经验之谈:“think like your agent”。当你在迭代系统时,要不断问自己:在当前信息和反馈条件下,一个 Agent 为什么会做出这个选择?这个视角的切换,往往能暴露提示设计、工具接口或反馈信号中的隐性问题。Barry 承认,这是一种需要时间培养的直觉,但也是区分“能跑”和“好用”的关键。

总结

整场演讲没有炫技,也没有预测遥远的未来,而是反复提醒一个简单事实:Agent 的威力,来自克制而非堆叠。知道什么时候不用 Agent,比知道怎么用更重要;能站在 Agent 的视角审视系统,往往比引入新组件更有效。对正在构建 AI 产品的团队来说,这套方法论本身,就是一次重要的降噪。


关键词: AI Agent, 工作流, 系统设计, 代码生成, Anthropic

事实核查备注: 1. 演讲者:Barry Zhang(视频中自我介绍)
2. 核心观点原话:“Don't build agents for everything.”、“keep it simple.”、“think like your agent.”
3. 概念区分:summarization/classification/extraction → workflows → agents
4. Agent 定义特征:可根据环境反馈自主决定轨迹
5. 正面用例:编码(从设计文档到 PR)