Function Calling 之后,AI Agent 正在悄悄换一条进化路线

AI PM 编辑部 · 2025年04月23日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。

Function Calling 之后,AI Agent 正在悄悄换一条进化路线

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。

从文本补全到函数调用:一次被低估的抽象升级

为什么函数调用值得单独讲一整场工作坊?Ilan 在一开始就给出了历史视角:大语言模型最初只是“文本补全”,后来人们不断在其之上叠加提示词、模板和模式。但这些技巧的天花板很快显现,因为模型只能“说”,却无法真正“做”。

他明确指出,函数调用并不是一个小功能,而是一次抽象层级的跃迁。“Functions are so so so powerful and we're going to look at a few cases today.” 在他看来,函数调用第一次让模型具备了结构化理解意图、并将其映射为确定性行为的能力。模型不再只是输出自然语言,而是可以选择、填充并触发开发者定义的函数。

Ilan 特意区分了两个概念:tools 与 functions。Tools 是更广义的托管能力集合,而 functions 是其中最基础、也是最可控的一种。这种区分的重要性在于,它决定了你是在“给模型一个按钮”,还是在“让模型学会什么时候该按哪个按钮”。这正是后续 Agent 架构的起点。

从一次函数调用,到完整 Agent 循环

在快速演示了“最基础的 function calling 设置”之后,Ilan 并没有停留在 API 用法层面,而是直接往前推了一步:如果把一次调用放进循环里,会发生什么?

他在现场把这个结构称为“the whole loop”,甚至半开玩笑地说这是他在脑子里反复运行的“run full turn”。这个循环的核心并不复杂:模型接收输入 → 判断是否需要调用函数 → 获取函数结果 → 再次推理并输出。但一旦这个循环成立,你就不再是在写一次性脚本,而是在构建一个持续决策的实体。

接下来,他加入了一个看似简单却至关重要的元素:记忆。Ilan 用一种非常工程师式的幽默宣布:“We've implemented memory, right?” 并得到了现场的掌声。这里的记忆并非复杂的长期存储系统,而是最基础的状态保留——但正是它,让 Agent 开始具备连续性,而不只是一次问答。

委托与异步:当 Agent 不再“坐着等结果”

如果说前面的内容还停留在“可用”,那么委托(delegation)和异步执行,则让 Agent 走向“可扩展”。Ilan 特意强调,很多系统在引入工具后,仍然隐含着一个问题:模型在调用函数时,其实是在“坐着等”。

他现场对比了几种委托方式,指出之前的实现虽然完成了任务,但本质上只是同步阻塞。“That's delegation but we were just sitting there waiting for it.” 这句话点出了问题的核心:当任务变多、变慢时,这种模式会迅速拖垮系统。

于是他引入了异步思维,并让观众“停下来想一想”,甚至直接点名可以用当时的新模型 o1 来做这件事。异步不仅是性能优化,更是一种架构选择——它允许 Agent 在等待某个结果的同时,继续规划、调度或处理其他任务。这一步,让 Agent 更像一个真实的执行者,而不是函数包装器。

当函数变成上百个:以及为什么代码生成可能是答案

真正的挑战出现在规模化阶段。Ilan 非常坦率地描述了这个状态:当你有几十甚至上百个函数时,模型在做的事情,往往只是“a glorified triage through multiple functions”。这并不优雅,也不令人满意。

正是在这里,他抛出了整场分享中最具前瞻性的判断之一:相比不断堆叠工具调用,我们可能正在走向“generated code agents”。也就是说,不是让模型在既有函数列表里做选择,而是直接生成一段可执行代码,来完成目标。

Ilan 形容这是“one of the coolest little programs I've ever made”。这并不是营销式的夸张,而是一种开发者的真实兴奋感:当模型开始生成逻辑,而不只是调用接口,Agent 的能力边界被再次推远。这一判断,也为整场工作坊画上了一个开放但清晰的句号。

总结

这场关于 Function Calling 的工作坊,真正的价值并不在 API 细节,而在于它展示了一条清晰的演进路线:从文本补全,到函数调用;从一次调用,到 Agent 循环;从同步执行,到异步委托;再到可能的代码生成式 Agent。对开发者而言,最大的启发或许是:不要把函数调用当成功能,而要把它当成一种新的“组织智能”的方式。


关键词: Function Calling, AI Agent, 大语言模型, OpenAI, o1

事实核查备注: 主讲人:Ilan Bigio(OpenAI Developer Experience 团队);视频标题:Function Calling is All You Need;频道:AI Engineer;发布时间:2025-04-23;涉及技术概念:Function Calling、Tools、AI Agent、Memory、Delegation、Async、Generated Code Agents;涉及产品:o1;引用原话包括“Functions are so so so powerful”、“We've implemented memory, right?”、“a glorified triage through multiple functions”、“one of the coolest little programs I've ever made”。