为什么2025会成为AI Agent落地元年?MCP给出的答案

AI PM 编辑部 · 2025年06月11日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

Last Mile AI CEO Sarmad Qadri结合自己从语言服务器协议到AI Agent的长期经验,提出了一个关键判断:2025年将是Agent大规模进入生产环境的一年。在这次分享中,他系统解释了Agent技术栈的三大变化、MCP为何会成为事实标准,以及为什么“Agent本质上是异步工作流”。

为什么2025会成为AI Agent落地元年?MCP给出的答案

Last Mile AI CEO Sarmad Qadri结合自己从语言服务器协议到AI Agent的长期经验,提出了一个关键判断:2025年将是Agent大规模进入生产环境的一年。在这次分享中,他系统解释了Agent技术栈的三大变化、MCP为何会成为事实标准,以及为什么“Agent本质上是异步工作流”。

从LSP到MCP:一个标准改变生态的亲历者视角

理解MCP的重要性,离不开Sarmad Qadri的个人经历。他在演讲中花了不短的时间回溯自己2016到2018年在Microsoft参与语言服务器协议(LSP)的经历。那是一个开发者工具极度碎片化的时代:每个IDE都有自己的一套API,每个语言工具都要为VS Code、Eclipse等分别实现一遍。Sarmad回忆说,这种局面“非常割裂”,而LSP通过“标准化一个统一的接口”,彻底改变了生态。

今天,他在大模型领域看到了惊人的相似性。在MCP出现之前,LLM要连接工具、数据和外部系统,往往依赖平台私有的集成方式,成本高、可移植性差。Sarmad直言,早在“tool calling还没成为主流之前”,他就在思考:是否可能为LLM打造一个类似LSP的协议。

MCP正是这个问题的答案。它定义了一种标准方式,让模型获取上下文、调用工具、访问资源,而不再依赖每家平台各自为政的接口。Sarmad强调,MCP真正革命性的地方在于“它提供了一个单一接口”,而且更重要的是,Google、OpenAI、Microsoft等潜在竞争对手已经在这一点上形成共识。这种罕见的行业合流,让他判断:MCP将成为LLM连接现实世界的事实标准。

2025年的Agent技术栈:复杂性正在“左移”

为什么Sarmad反复强调“2025是Agent之年”?答案藏在Agent技术栈正在发生的三大变化中。首先是模型本身的跃迁。他指出,推理模型和新一代LLM在可靠性上已经跨过了一个门槛,足以支撑真实业务场景。

更关键的是,过去由框架层承担的大量复杂逻辑,正在向推理阶段“左移”。像Chain-of-Thought、ReAct等曾经需要工程师手动编排的模式,如今越来越多地由模型在推理时完成。Sarmad的原话是:“这给应用开发者带来的直接好处是,你只需要调用模型API,就能完成以前复杂得多的事情。”

第二个变化正是MCP本身。它不只是一个“数据连接器”,而是为Agent提供了一个稳定、统一的外部世界接口。第三个变化,则是架构层面的简化。Sarmad明确表示,构建Agent已经“不再需要庞大的、单体式的AI框架”。现代Agent更像是一个轻量的协调者:有一个规划器(planner),根据当前状态动态决定下一步行动,然后通过MCP调用模型和工具。

这三点叠加在一起,直接降低了Agent从概念验证走向生产的门槛。

被卡在PoC的真实需求,终于等到了Agent

在演讲中,Sarmad多次提到一个让他印象深刻的现象:过去几年,客户有大量“高价值用例”,却始终停留在PoC阶段。他点名了几个典型场景:工作流自动化、非结构化数据处理、信息检索。这些需求并不新,但以前的Agent技术要么不稳定,要么成本过高。

他的判断是,随着模型能力、MCP标准化和架构简化同时成熟,这些场景正在被快速激活。“你已经开始在每一个类别中看到Agent出现了,而且这种模式会在接下来几个月加速。”这并不是一个抽象的趋势判断,而是来自真实客户项目的观察。

这些Agent不再追求炫技式的自主性,而是围绕具体业务目标,可靠地完成任务。这也是Sarmad反复强调“有效的Agent(effective agents)”的原因:不是能做多少事,而是能否在生产环境中长期运行、可控、可维护。

Agent不是聊天机器人,而是异步工作流

全场最具方法论价值的一句话,来自Sarmad对Agent本质的定义:“Agents are async workflows.”在他看来,把Agent当成一次性、同步的对话过程,是很多系统设计失败的根源。

真实世界的Agent任务往往需要被暂停、恢复、重试,甚至在中途引入人工干预。这些特性天然属于异步工作流,而不是一次chat session。基于这一认识,Sarmad主张用成熟的工作流编排基础设施来建模Agent,例如Airflow、Temporal这类系统。

当Agent被建模为异步工作流后,很多问题会迎刃而解:系统具备更好的可扩展性、性能和持久性。他在演讲后半段通过Demo展示了这一思路如何落地,并在最后一步,将整个Agent“暴露为一个MCP server”。这意味着,Agent本身也可以像工具一样,被其他模型或Agent调用。

这一设计形成了一个闭环:MCP不仅连接工具,也连接Agent;Agent不只是消费者,也可以成为基础设施的一部分。

总结

Sarmad Qadri的分享之所以有说服力,不只是因为他看好Agent,而是因为他给出了清晰的技术与架构理由。从LSP到MCP,从单体框架到异步工作流,他反复证明:真正改变生态的,往往是标准化和工程化。对开发者而言,2025年的问题不再是“要不要做Agent”,而是“是否用对了模型、协议和架构”。


关键词: AI Agent, MCP, 模型上下文协议, 异步工作流, 大语言模型

事实核查备注: 人物:Sarmad Qadri(Last Mile AI CEO);协议:Language Server Protocol(LSP)、Model Context Protocol(MCP);公司:Microsoft、Google、OpenAI;技术概念:AI Agent、异步工作流、Airflow、Temporal、推理模型