别再只盯着Agent了：Tool Calling才是AI系统的真正地基

AI PM 编辑部 · 2025年02月22日 · 19 阅读 · AI/人工智能

AI Agent 提示工程大语言模型 LangChain Y Combinator

正在加载视频...

视频章节

Roy Derks在这场演讲中提出一个被严重低估的观点：AI Agent的能力上限，往往不是模型或框架决定的，而是由工具（Tool Calling）决定的。他结合自身创业与工程经验，系统讲解了为什么工具不是“管道”，而是AI应用层最重要的资产。

别再只盯着Agent了：Tool Calling才是AI系统的真正地基

Roy Derks在这场演讲中提出一个被严重低估的观点：AI Agent的能力上限，往往不是模型或框架决定的，而是由工具（Tool Calling）决定的。他结合自身创业与工程经验，系统讲解了为什么工具不是“管道”，而是AI应用层最重要的资产。

一个被忽视的事实：Agent出问题，最先坏的永远是工具

这场演讲一开始，Roy Derks就抛出了一个让很多工程师点头的判断：我们花了太多时间优化Agent，却几乎没怎么认真对待工具本身。他直言不讳地说：“Every time I'm building an agent， the first thing that breaks is the tools.” 不是模型不够聪明，而是模型调用工具失败、用错工具，或者工具本身不够健壮。

在一个典型的Agent Loop里，用户输入、LLM、记忆模块和工具是并列存在的组成部分，但现实中，大多数讨论都集中在“我该用哪个Agent Framework”。结果就是：工具要么直接写死在框架里，要么完全依赖框架自带的示例工具。Roy形容这种状态像“封闭电路”：Agent是稳定的黑盒，而工具却是最动态、最容易出问题的部分。

他引用了一句老话来强化这个观点：“A man is only as good as your tools。”随即给出自己的改写版金句——“The agent is only as good as their tools。”这不是修辞，而是工程现实：只要工具不可靠、不复用、不易迁移，再先进的Agent架构也会迅速变得脆弱。

工具不是函数签名，而是给模型看的“系统提示”

在进入具体实现前，Roy花了相当篇幅解释：为什么“如何定义工具”本身就是一门被低估的提示工程。他指出，一个工具定义至少包含四个关键部分：工具名、工具描述、输入参数，以及越来越重要的输出Schema。

其中最容易被低估的，是工具描述（description）。在Roy看来，这几乎就是一个“专门写给模型看的系统提示”。他说，大型、复杂的工具描述往往并不简短，甚至会出现“像System Prompt一样长”的情况。有些团队甚至会在系统提示和工具描述之间重复信息，这并不是浪费，而是为了提高模型在调用工具时的稳定性。

他还特别强调了输出Schema的重要性。在一些Agentic Framework中，输出结构已经成为工具输入的一部分，这让工具调用具备了类型安全（type-safe）的特性。这一点对长期维护至关重要，因为它减少了模型“猜结构”的空间，也降低了工具升级时引入隐性错误的概率。

Roy的态度非常工程师化：工具不是一次性写完的函数，而是需要被长期维护、跨框架复用的软件资产。

从登月距离到真实世界：Tool Calling的工作方式

为了让抽象概念落地，Roy举了一个轻松却信息密度很高的例子。他问Agent：“月球绕地一圈，相当于阿姆斯特丹和旧金山之间往返多少次？”这个问题之所以有趣，是因为它处在“模型可能知道，但不完全可靠”的灰色地带。

他解释说，模型有两种可能路径：一种是直接从训练数据中推断出答案；另一种，也是更常见、更稳妥的方式，是通过Tool Calling。Agent可能先调用外部API查询地月距离，再查询阿姆斯特丹到旧金山的航程距离，最后通过计算工具得出结果。

Roy还顺势扩展了问题复杂度：如果不是单纯比较距离，而是比较“时间成本”呢？一次航程需要10到12小时，还要加上机场等待时间。这时，Agent几乎不可能只靠语言模型本身完成推理，而必须依赖多个工具协作。

这个例子背后的核心信息是：Tool Calling不是锦上添花，而是让Agent具备现实世界行动能力的前提。

为什么“内嵌式工具”正在成为瓶颈

在展示了类似LangChain的工具定义方式后，Roy明确指出了一个问题：当工具完全嵌在Agent Framework内部时，开发者几乎失去了对执行过程的控制。他称这种方式为“embedded tool calling”。

在这种模式下，应用层只负责发出问题，Agent内部完成所有决策、调用和执行。对外部系统来说，这是一整个黑盒。“No control over whatever going on inside of it.” 对习惯了系统解耦的资深开发者而言，这种状态是难以接受的。

正因为如此，Roy对将工具从Agent Framework中分离出来格外感兴趣。他提到，像MCP这样的方向，正在尝试让Tool Calling成为一个独立层级，而不是框架的附属功能。这一趋势也正在市场上得到验证——已经有多家Y Combinator背景的创业公司进入“独立工具平台”这一赛道。

在Roy看来，这种解耦带来的最大价值是灵活性：你可以更换Agent Framework，却继续复用同一套稳定、健壮的工具系统。

总结

Roy Derks的核心信息非常明确：Agent并不是AI系统中最稀缺、最值得投入的部分，真正决定系统上限的是工具。他希望听众在演讲结束后能有一种自信——“我可以自己构建工具，把它们独立于Agent Framework存在。”当模型能力不断提升，应用层和工具层如果跟不上，AI系统依然会停留在演示阶段。这不是未来猜想，而是当下正在发生的工程现实。

关键词： AI Agent， Tool Calling，大语言模型， LangChain，提示工程

事实核查备注：演讲者：Roy Derks；视频标题：Tool Calling Is Not Just Plumbing for AI Agents；发布时间：2025-02-22；频道：AI Engineer；核心技术名词：AI Agent、Tool Calling、Agent Loop、LangChain、MCP；示例案例：月球绕地距离≈阿姆斯特丹-旧金山往返约44次（演讲中提及）；引用观点：“The agent is only as good as their tools.”；市场趋势：Y Combinator相关创业公司进入独立工具平台领域。

返回文章列表