别再只盯着Agent了:Tool Calling才是AI系统的真正地基
正在加载视频...
视频章节
Roy Derks在这场演讲中提出一个被严重低估的观点:AI Agent的能力上限,往往不是模型或框架决定的,而是由工具(Tool Calling)决定的。他结合自身创业与工程经验,系统讲解了为什么工具不是“管道”,而是AI应用层最重要的资产。
别再只盯着Agent了:Tool Calling才是AI系统的真正地基
Roy Derks在这场演讲中提出一个被严重低估的观点:AI Agent的能力上限,往往不是模型或框架决定的,而是由工具(Tool Calling)决定的。他结合自身创业与工程经验,系统讲解了为什么工具不是“管道”,而是AI应用层最重要的资产。
一个被忽视的事实:Agent出问题,最先坏的永远是工具
这场演讲一开始,Roy Derks就抛出了一个让很多工程师点头的判断:我们花了太多时间优化Agent,却几乎没怎么认真对待工具本身。他直言不讳地说:“Every time I'm building an agent, the first thing that breaks is the tools.” 不是模型不够聪明,而是模型调用工具失败、用错工具,或者工具本身不够健壮。
在一个典型的Agent Loop里,用户输入、LLM、记忆模块和工具是并列存在的组成部分,但现实中,大多数讨论都集中在“我该用哪个Agent Framework”。结果就是:工具要么直接写死在框架里,要么完全依赖框架自带的示例工具。Roy形容这种状态像“封闭电路”:Agent是稳定的黑盒,而工具却是最动态、最容易出问题的部分。
他引用了一句老话来强化这个观点:“A man is only as good as your tools。”随即给出自己的改写版金句——“The agent is only as good as their tools。”这不是修辞,而是工程现实:只要工具不可靠、不复用、不易迁移,再先进的Agent架构也会迅速变得脆弱。
工具不是函数签名,而是给模型看的“系统提示”
在进入具体实现前,Roy花了相当篇幅解释:为什么“如何定义工具”本身就是一门被低估的提示工程。他指出,一个工具定义至少包含四个关键部分:工具名、工具描述、输入参数,以及越来越重要的输出Schema。
其中最容易被低估的,是工具描述(description)。在Roy看来,这几乎就是一个“专门写给模型看的系统提示”。他说,大型、复杂的工具描述往往并不简短,甚至会出现“像System Prompt一样长”的情况。有些团队甚至会在系统提示和工具描述之间重复信息,这并不是浪费,而是为了提高模型在调用工具时的稳定性。
他还特别强调了输出Schema的重要性。在一些Agentic Framework中,输出结构已经成为工具输入的一部分,这让工具调用具备了类型安全(type-safe)的特性。这一点对长期维护至关重要,因为它减少了模型“猜结构”的空间,也降低了工具升级时引入隐性错误的概率。
Roy的态度非常工程师化:工具不是一次性写完的函数,而是需要被长期维护、跨框架复用的软件资产。
从登月距离到真实世界:Tool Calling的工作方式
为了让抽象概念落地,Roy举了一个轻松却信息密度很高的例子。他问Agent:“月球绕地一圈,相当于阿姆斯特丹和旧金山之间往返多少次?”这个问题之所以有趣,是因为它处在“模型可能知道,但不完全可靠”的灰色地带。
他解释说,模型有两种可能路径:一种是直接从训练数据中推断出答案;另一种,也是更常见、更稳妥的方式,是通过Tool Calling。Agent可能先调用外部API查询地月距离,再查询阿姆斯特丹到旧金山的航程距离,最后通过计算工具得出结果。
Roy还顺势扩展了问题复杂度:如果不是单纯比较距离,而是比较“时间成本”呢?一次航程需要10到12小时,还要加上机场等待时间。这时,Agent几乎不可能只靠语言模型本身完成推理,而必须依赖多个工具协作。
这个例子背后的核心信息是:Tool Calling不是锦上添花,而是让Agent具备现实世界行动能力的前提。
为什么“内嵌式工具”正在成为瓶颈
在展示了类似LangChain的工具定义方式后,Roy明确指出了一个问题:当工具完全嵌在Agent Framework内部时,开发者几乎失去了对执行过程的控制。他称这种方式为“embedded tool calling”。
在这种模式下,应用层只负责发出问题,Agent内部完成所有决策、调用和执行。对外部系统来说,这是一整个黑盒。“No control over whatever going on inside of it.” 对习惯了系统解耦的资深开发者而言,这种状态是难以接受的。
正因为如此,Roy对将工具从Agent Framework中分离出来格外感兴趣。他提到,像MCP这样的方向,正在尝试让Tool Calling成为一个独立层级,而不是框架的附属功能。这一趋势也正在市场上得到验证——已经有多家Y Combinator背景的创业公司进入“独立工具平台”这一赛道。
在Roy看来,这种解耦带来的最大价值是灵活性:你可以更换Agent Framework,却继续复用同一套稳定、健壮的工具系统。
总结
Roy Derks的核心信息非常明确:Agent并不是AI系统中最稀缺、最值得投入的部分,真正决定系统上限的是工具。他希望听众在演讲结束后能有一种自信——“我可以自己构建工具,把它们独立于Agent Framework存在。”当模型能力不断提升,应用层和工具层如果跟不上,AI系统依然会停留在演示阶段。这不是未来猜想,而是当下正在发生的工程现实。
关键词: AI Agent, Tool Calling, 大语言模型, LangChain, 提示工程
事实核查备注: 演讲者:Roy Derks;视频标题:Tool Calling Is Not Just Plumbing for AI Agents;发布时间:2025-02-22;频道:AI Engineer;核心技术名词:AI Agent、Tool Calling、Agent Loop、LangChain、MCP;示例案例:月球绕地距离≈阿姆斯特丹-旧金山往返约44次(演讲中提及);引用观点:“The agent is only as good as their tools.”;市场趋势:Y Combinator相关创业公司进入独立工具平台领域。