为什么2025会成为AI Agent落地元年？MCP给出的答案

AI PM 编辑部 · 2025年06月11日 · 18 阅读 · AI/人工智能

推理 AI Agent 大语言模型 Microsoft Google OpenAI

正在加载视频...

视频章节

Last Mile AI CEO Sarmad Qadri结合自己从语言服务器协议到AI Agent的长期经验，提出了一个关键判断：2025年将是Agent大规模进入生产环境的一年。在这次分享中，他系统解释了Agent技术栈的三大变化、MCP为何会成为事实标准，以及为什么“Agent本质上是异步工作流”。

为什么2025会成为AI Agent落地元年？MCP给出的答案

Last Mile AI CEO Sarmad Qadri结合自己从语言服务器协议到AI Agent的长期经验，提出了一个关键判断：2025年将是Agent大规模进入生产环境的一年。在这次分享中，他系统解释了Agent技术栈的三大变化、MCP为何会成为事实标准，以及为什么“Agent本质上是异步工作流”。

从LSP到MCP：一个标准改变生态的亲历者视角

理解MCP的重要性，离不开Sarmad Qadri的个人经历。他在演讲中花了不短的时间回溯自己2016到2018年在Microsoft参与语言服务器协议（LSP）的经历。那是一个开发者工具极度碎片化的时代：每个IDE都有自己的一套API，每个语言工具都要为VS Code、Eclipse等分别实现一遍。Sarmad回忆说，这种局面“非常割裂”，而LSP通过“标准化一个统一的接口”，彻底改变了生态。

今天，他在大模型领域看到了惊人的相似性。在MCP出现之前，LLM要连接工具、数据和外部系统，往往依赖平台私有的集成方式，成本高、可移植性差。Sarmad直言，早在“tool calling还没成为主流之前”，他就在思考：是否可能为LLM打造一个类似LSP的协议。

MCP正是这个问题的答案。它定义了一种标准方式，让模型获取上下文、调用工具、访问资源，而不再依赖每家平台各自为政的接口。Sarmad强调，MCP真正革命性的地方在于“它提供了一个单一接口”，而且更重要的是，Google、OpenAI、Microsoft等潜在竞争对手已经在这一点上形成共识。这种罕见的行业合流，让他判断：MCP将成为LLM连接现实世界的事实标准。

2025年的Agent技术栈：复杂性正在“左移”

为什么Sarmad反复强调“2025是Agent之年”？答案藏在Agent技术栈正在发生的三大变化中。首先是模型本身的跃迁。他指出，推理模型和新一代LLM在可靠性上已经跨过了一个门槛，足以支撑真实业务场景。

更关键的是，过去由框架层承担的大量复杂逻辑，正在向推理阶段“左移”。像Chain-of-Thought、ReAct等曾经需要工程师手动编排的模式，如今越来越多地由模型在推理时完成。Sarmad的原话是：“这给应用开发者带来的直接好处是，你只需要调用模型API，就能完成以前复杂得多的事情。”

第二个变化正是MCP本身。它不只是一个“数据连接器”，而是为Agent提供了一个稳定、统一的外部世界接口。第三个变化，则是架构层面的简化。Sarmad明确表示，构建Agent已经“不再需要庞大的、单体式的AI框架”。现代Agent更像是一个轻量的协调者：有一个规划器（planner），根据当前状态动态决定下一步行动，然后通过MCP调用模型和工具。

这三点叠加在一起，直接降低了Agent从概念验证走向生产的门槛。

被卡在PoC的真实需求，终于等到了Agent

在演讲中，Sarmad多次提到一个让他印象深刻的现象：过去几年，客户有大量“高价值用例”，却始终停留在PoC阶段。他点名了几个典型场景：工作流自动化、非结构化数据处理、信息检索。这些需求并不新，但以前的Agent技术要么不稳定，要么成本过高。

他的判断是，随着模型能力、MCP标准化和架构简化同时成熟，这些场景正在被快速激活。“你已经开始在每一个类别中看到Agent出现了，而且这种模式会在接下来几个月加速。”这并不是一个抽象的趋势判断，而是来自真实客户项目的观察。

这些Agent不再追求炫技式的自主性，而是围绕具体业务目标，可靠地完成任务。这也是Sarmad反复强调“有效的Agent（effective agents）”的原因：不是能做多少事，而是能否在生产环境中长期运行、可控、可维护。

Agent不是聊天机器人，而是异步工作流

全场最具方法论价值的一句话，来自Sarmad对Agent本质的定义：“Agents are async workflows.”在他看来，把Agent当成一次性、同步的对话过程，是很多系统设计失败的根源。

真实世界的Agent任务往往需要被暂停、恢复、重试，甚至在中途引入人工干预。这些特性天然属于异步工作流，而不是一次chat session。基于这一认识，Sarmad主张用成熟的工作流编排基础设施来建模Agent，例如Airflow、Temporal这类系统。

当Agent被建模为异步工作流后，很多问题会迎刃而解：系统具备更好的可扩展性、性能和持久性。他在演讲后半段通过Demo展示了这一思路如何落地，并在最后一步，将整个Agent“暴露为一个MCP server”。这意味着，Agent本身也可以像工具一样，被其他模型或Agent调用。

这一设计形成了一个闭环：MCP不仅连接工具，也连接Agent；Agent不只是消费者，也可以成为基础设施的一部分。

总结

Sarmad Qadri的分享之所以有说服力，不只是因为他看好Agent，而是因为他给出了清晰的技术与架构理由。从LSP到MCP，从单体框架到异步工作流，他反复证明：真正改变生态的，往往是标准化和工程化。对开发者而言，2025年的问题不再是“要不要做Agent”，而是“是否用对了模型、协议和架构”。

关键词： AI Agent， MCP，模型上下文协议，异步工作流，大语言模型

事实核查备注：人物：Sarmad Qadri（Last Mile AI CEO）；协议：Language Server Protocol（LSP）、Model Context Protocol（MCP）；公司：Microsoft、Google、OpenAI；技术概念：AI Agent、异步工作流、Airflow、Temporal、推理模型

返回文章列表