别再让Agent当打杂的:为什么工具也该有“思考权”

AI PM 编辑部 · 2025年06月10日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

大模型Agent的失败,往往不是模型不够聪明,而是工具太“愚蠢”。Wordware联合创始人Robert Chandler结合自动驾驶与AI Agent实践,提出一个反直觉但关键的观点:不要让Agent被低级工具拖累,而是让工具本身具备更多“代理性”,真正学会替人思考和行动。

别再让Agent当打杂的:为什么工具也该有“思考权”

大模型Agent的失败,往往不是模型不够聪明,而是工具太“愚蠢”。Wordware联合创始人Robert Chandler结合自动驾驶与AI Agent实践,提出一个反直觉但关键的观点:不要让Agent被低级工具拖累,而是让工具本身具备更多“代理性”,真正学会替人思考和行动。

从自动驾驶到AI Agent:可靠性是刻在骨子里的执念

为什么很多AI Agent在Demo里看起来无所不能,真正用起来却一塌糊涂?Robert Chandler一开场就给出了他的背景答案:在创办Wordware之前,他长期从事自动驾驶相关工作,而“构建高可靠系统”早已成为他的职业本能。

在他看来,Agent的理想状态非常诱人——“自动化系统,能够代表你在真实世界中采取行动”,它们理解你和团队的上下文,能操作你每天使用的工具,并把结果准确地送到你需要的地方。这不是聊天机器人,而是可以落地执行的数字同事。

但正是这种对可靠性的执念,让他对当前Agent生态保持警惕。他直言不讳地说,现实中的Agent“往往又慢、又贵、又不可靠”。这并非模型能力不足,而是系统设计出了问题。正如自动驾驶中最危险的不是算法不够复杂,而是系统在边界条件下失控,Agent的问题,也更多出在“工具层”。

那条5分钟才发出去的Slack消息,暴露了MCP的致命伤

Robert分享了一个让现场观众发笑、但用户一定笑不出来的真实经历。当MCP(Model Context Protocol)刚出现时,他把Slack接入系统,只想做一件极简单的事:给Philip发一条私信——“我在用MCP,真的很酷”。

结果却是一场灾难。Agent先是列出Slack频道里的所有用户,又跑去遍历所有频道,反复尝试定位目标用户。最后,它“放弃了理性”,直接在公共频道发了一条消息:“有人能告诉Philip,MCP真的很棒吗?”整个过程花了大约5分钟。

这个故事精准揭示了问题核心:大多数MCP工具,本质只是为程序员设计的API的语言模型包装层。它们返回的是大块JSON,这对确定性状态机很友好,却严重污染了大模型的上下文窗口。分页、多次函数调用、认证流程,都迫使模型在越来越长的请求链中维持推理,结果就是又慢又不稳定。

正如Robert总结的那样:“这些工具的粒度太小了,小到让语言模型根本没法持续思考。”

别再给T-Rex发扳手:工具也应该像“复仇者联盟”

那问题该怎么解决?Robert给出了一个极具画面感的比喻:让一个强大的Agent去操作一堆极其琐碎的工具,就像“让一只T-Rex拿着一把小扳手干活”。理论上可行,实际上荒谬。

他的答案是:给工具更多“代理性”。不要再把工具设计成只能完成单一步骤的函数,而是让工具本身具备完整任务的执行能力,甚至内部就包含多个推理和集成步骤。他把这种结构比作“复仇者联盟”:有的成员擅长蛮力,有的负责高精度任务,而主Agent更像Iron Man,负责统筹。

在这种架构下,工具和Agent的边界开始模糊。“什么时候一个Agent,其实只是另一个Agent的工具?”Robert把这个问题直接抛给了观众。关键不在定义,而在结果:为这些‘工具型Agent’提供简洁、自然语言的接口,输出高质量、可复用、可靠的结果,让主Agent可以放心‘外包思考’。

Wordware的演示:把复杂推理,封装成一次调用

为了证明这不是空谈,Robert现场演示了Wordware的新MCP Toolbox。他选择的例子并不简单:竞品分析。这类任务不仅需要判断力和审美,还要同时集成Twitter和Notion。

他的做法并不是给Agent接一个“Twitter MCP”,而是在Wordware里构建一个完整的分析流程:抓取竞品推文、根据他明确描述的关注点进行分析、生成总结,并自动写入Notion,最后只返回一个Notion页面链接。Agent不需要理解分页、API结构或数据清洗,只需要调用这个‘工具’。

随后,他把这个工具箱接入Claude。在对话中触发“Anthropic的竞品分析”后,Claude调用Wordware工具,一次性完成任务。最终呈现的是一份排版良好、长期可查的Notion文档,而不是一段很快被聊天记录淹没的文本。

Robert强调,这种方式的价值在于:我们构建了一个“高度可靠、可重复、且高度对齐”的工具,让通用Agent在特定任务上变得极其强大。工具不再是负担,而是专家。

总结

Robert Chandler的核心观点其实很简单,却常被忽略:当AI Agent表现不佳时,问题往往不在“大脑”,而在“工具”。与其逼迫语言模型在混乱的API细节中挣扎,不如把复杂性前移,封装进更有“思考能力”的工具里。

这是一种系统工程视角的转变,也是一种团队协作的隐喻——就像现实世界中,我们不会让CEO亲自填报每一张报表。对每一个正在构建Agent系统的人来说,这个视频真正的启发是:别只想着让Agent更聪明,先让它的工具,值得被信任。


关键词: AI Agent, MCP, 上下文窗口, AI工具设计, Wordware

事实核查备注: Robert Chandler:Wordware联合创始人兼CTO;背景:曾从事自动驾驶相关工作。MCP:Model Context Protocol。案例:Slack发送消息失败,耗时约5分钟。产品与工具:Wordware MCP Toolbox、Claude。演示集成平台:Twitter、Notion。涉及公司:Anthropic。