Function Calling 之后,AI Agent 正在悄悄换一条进化路线
正在加载视频...
视频章节
这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。
Function Calling 之后,AI Agent 正在悄悄换一条进化路线
这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。
从文本补全到函数调用:一次被低估的抽象升级
为什么函数调用值得单独讲一整场工作坊?Ilan 在一开始就给出了历史视角:大语言模型最初只是“文本补全”,后来人们不断在其之上叠加提示词、模板和模式。但这些技巧的天花板很快显现,因为模型只能“说”,却无法真正“做”。
他明确指出,函数调用并不是一个小功能,而是一次抽象层级的跃迁。“Functions are so so so powerful and we're going to look at a few cases today.” 在他看来,函数调用第一次让模型具备了结构化理解意图、并将其映射为确定性行为的能力。模型不再只是输出自然语言,而是可以选择、填充并触发开发者定义的函数。
Ilan 特意区分了两个概念:tools 与 functions。Tools 是更广义的托管能力集合,而 functions 是其中最基础、也是最可控的一种。这种区分的重要性在于,它决定了你是在“给模型一个按钮”,还是在“让模型学会什么时候该按哪个按钮”。这正是后续 Agent 架构的起点。
从一次函数调用,到完整 Agent 循环
在快速演示了“最基础的 function calling 设置”之后,Ilan 并没有停留在 API 用法层面,而是直接往前推了一步:如果把一次调用放进循环里,会发生什么?
他在现场把这个结构称为“the whole loop”,甚至半开玩笑地说这是他在脑子里反复运行的“run full turn”。这个循环的核心并不复杂:模型接收输入 → 判断是否需要调用函数 → 获取函数结果 → 再次推理并输出。但一旦这个循环成立,你就不再是在写一次性脚本,而是在构建一个持续决策的实体。
接下来,他加入了一个看似简单却至关重要的元素:记忆。Ilan 用一种非常工程师式的幽默宣布:“We've implemented memory, right?” 并得到了现场的掌声。这里的记忆并非复杂的长期存储系统,而是最基础的状态保留——但正是它,让 Agent 开始具备连续性,而不只是一次问答。
委托与异步:当 Agent 不再“坐着等结果”
如果说前面的内容还停留在“可用”,那么委托(delegation)和异步执行,则让 Agent 走向“可扩展”。Ilan 特意强调,很多系统在引入工具后,仍然隐含着一个问题:模型在调用函数时,其实是在“坐着等”。
他现场对比了几种委托方式,指出之前的实现虽然完成了任务,但本质上只是同步阻塞。“That's delegation but we were just sitting there waiting for it.” 这句话点出了问题的核心:当任务变多、变慢时,这种模式会迅速拖垮系统。
于是他引入了异步思维,并让观众“停下来想一想”,甚至直接点名可以用当时的新模型 o1 来做这件事。异步不仅是性能优化,更是一种架构选择——它允许 Agent 在等待某个结果的同时,继续规划、调度或处理其他任务。这一步,让 Agent 更像一个真实的执行者,而不是函数包装器。
当函数变成上百个:以及为什么代码生成可能是答案
真正的挑战出现在规模化阶段。Ilan 非常坦率地描述了这个状态:当你有几十甚至上百个函数时,模型在做的事情,往往只是“a glorified triage through multiple functions”。这并不优雅,也不令人满意。
正是在这里,他抛出了整场分享中最具前瞻性的判断之一:相比不断堆叠工具调用,我们可能正在走向“generated code agents”。也就是说,不是让模型在既有函数列表里做选择,而是直接生成一段可执行代码,来完成目标。
Ilan 形容这是“one of the coolest little programs I've ever made”。这并不是营销式的夸张,而是一种开发者的真实兴奋感:当模型开始生成逻辑,而不只是调用接口,Agent 的能力边界被再次推远。这一判断,也为整场工作坊画上了一个开放但清晰的句号。
总结
这场关于 Function Calling 的工作坊,真正的价值并不在 API 细节,而在于它展示了一条清晰的演进路线:从文本补全,到函数调用;从一次调用,到 Agent 循环;从同步执行,到异步委托;再到可能的代码生成式 Agent。对开发者而言,最大的启发或许是:不要把函数调用当成功能,而要把它当成一种新的“组织智能”的方式。
关键词: Function Calling, AI Agent, 大语言模型, OpenAI, o1
事实核查备注: 主讲人:Ilan Bigio(OpenAI Developer Experience 团队);视频标题:Function Calling is All You Need;频道:AI Engineer;发布时间:2025-04-23;涉及技术概念:Function Calling、Tools、AI Agent、Memory、Delegation、Async、Generated Code Agents;涉及产品:o1;引用原话包括“Functions are so so so powerful”、“We've implemented memory, right?”、“a glorified triage through multiple functions”、“one of the coolest little programs I've ever made”。