MCP的真正野心:让大模型“走出对话框”

AI PM 编辑部 · 2025年06月18日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

Anthropic 产品经理 Theodora Chu 亲述 MCP 的起源与野心:它并不是又一个工具调用协议,而是一场围绕“模型自主性”的长期赌注。从工程师反复复制上下文的痛点,到 Cursor、Google、OpenAI 的集体采用,这次演讲给了创业者非常具体的判断框架:接下来该往哪里建。

MCP的真正野心:让大模型“走出对话框”

Anthropic 产品经理 Theodora Chu 亲述 MCP 的起源与野心:它并不是又一个工具调用协议,而是一场围绕“模型自主性”的长期赌注。从工程师反复复制上下文的痛点,到 Cursor、Google、OpenAI 的集体采用,这次演讲给了创业者非常具体的判断框架:接下来该往哪里建。

从复制粘贴到模型自主性:MCP诞生的真实起点

理解 MCP,必须从一个极其“工程师日常”的痛点开始。Theodora Chu 回忆,MCP 的最初灵感来自两位工程师 David 和 Justin 的反复吐槽:他们在使用大模型时,不断把 Slack 消息、Sentry 报错、外部文档复制进上下文窗口。“你突然想起来,有一条 Slack 消息其实特别重要,于是只能手动拷进去。”

这个动作本身暴露了一个更深层的问题:模型被困在对话框里。Chu 用了一个非常形象的说法——他们希望 Claude 或任何 LLM 能“爬出盒子,伸手到现实世界中,把上下文和行动一起带回来”。这不仅是上下文的问题,而是“模型是否拥有行动能力(model agency)”。

也正是这个判断,决定了 MCP 从一开始就不是 Anthropic 的私有接口,而是一个必须开源、标准化的协议。Chu 直言,如果这是一个封闭生态,那么任何集成都要先走 BD、对齐接口、再开发,根本无法规模化。而他们认为,真正阻碍 LLM 进入下一个阶段的,不是推理能力,而是“是否被允许行动”。

为什么一定要是开源协议?以及一次并不被理解的发布

MCP 的第一个转折点发生在 2024 年 11 月的 Anthropic Hack Week。一个内部“tiger team”把协议做出来后,工程师们开始用 MCP 自动化自己的工作流,甚至跨团队使用。Chu 形容那一刻很像“从两个工程师在车库里,一下子走到了一个真正有价值的节点”。

但真正对外开源后,现实却并不浪漫。发布初期,团队反复听到的不是赞美,而是困惑:“什么是 MCP?”、“为什么需要一个新协议?”、“模型不是已经能调用工具了吗?”Chu 很坦诚地说,大多数 0 到 1 的产品,发布那一刻其实并不重要。

真正的拐点,是 Cursor 率先采用 MCP,随后 VS Code、Sourcegraph 等编码工具跟进。再往后,Google、Microsoft、OpenAI 的加入,让 MCP 开始具备‘标准’的雏形。但 Chu 特别强调一句话:“标准之所以成为标准,是因为它真的对开发者有用。”因此她公开邀请开发者提 issue、提 PR,甚至直接修协议本身——MCP 必须被社区持续“折磨”,才有价值。

为Agent而生的设计取舍:为什么让客户端更痛苦?

如果说 MCP 的核心赌注是什么,Chu 的答案非常清晰:Agent 是未来。她几乎预言式地说,“你们接下来会在每一场演讲里听到 agents 这个词。”但 MCP 对 agent 的理解并不是“多写几个 prompt”,而是:你要相信模型会自己选择行动。

正因为如此,MCP 在协议设计上做了几个颇具争议的决定。比如从 SSE 转向 streamable HTTP 作为主要传输方式。Chu 承认这在当时“非常有争议”,但原因很现实:如果 agent 之间需要双向通信,SSE 并不合适。

另一个关键判断是:未来 MCP 生态里,服务器会远多于客户端。基于这个假设,团队在所有权衡中都优先简化服务器,而把复杂性推给客户端。Chu 半开玩笑地向客户端开发者道歉,但也强调这是一个“非常刻意的决定”。这些取舍背后,本质上都是在为模型智能不断提升后的世界提前铺路。

过去六个月的修正与进化:社区正在重塑MCP

MCP 并不是一条直线式前进的协议。Chu 在演讲中罕见地公开承认:“我们一开始把 OAuth 做错了。”这个问题最终并不是内部修好的,而是社区成员根据真实身份系统的运作方式,直接参与修改了 draft spec。

除了 OAuth,过去半年 MCP 还支持了 remote MCP、正式切换到 streamable HTTP,并更新了 SDK 和 Inspector(一个被 Chu 称为“严重被低估”的调试工具)。更重要的是,协议开始围绕 agent 体验继续扩展,比如新增的 elicitation 机制。

她举了一个非常具体的例子:当用户说“帮我订去亚特兰大的最佳航班”时,服务器可以反问“最佳是最便宜还是最快?”,并把用户的回答重新传回。这看似细小,却是模型真正参与决策闭环的关键一步。

给创业者的答案:80%的机会,在“更好的服务器”

在演讲的最后,Chu 回答了她被问得最多的问题:“如果 MCP 成为标准,我该做什么?”她的答案非常不平均:80% 的机会在构建高质量 MCP 服务器,10% 在简化服务器构建工具,10% 是更激进的未来押注。

她对“高质量”的定义很尖锐:不是把现有 API 一比一包成工具。因为 MCP 服务器有三个用户——终端用户、客户端开发者,以及“模型本身”。很多人忘了,模型也是用户。你必须反过来思考:用户会怎么提问?模型需要哪些工具,才能正确回答?

此外,她明确希望 MCP 走出开发者工具,进入销售、金融、法律、教育等垂直领域。至于更激进的方向,她提到“自动生成 MCP 服务器”:当模型足够聪明时,它们将能实时为自己写 MCP。最后,她也提醒,随着模型越来越能“触达现实世界”,安全、审计和可观测性将成为不可回避的创业方向。

总结

这场演讲最有价值的地方,并不在于 MCP 的具体接口,而在于它背后的判断:大模型真正的下一步,不是更长的上下文,而是被允许行动。MCP 是一次提前下注,赌模型会越来越聪明,也赌开发者愿意为此构建基础设施。对创业者而言,机会并不在“追风口”,而在于是否真的理解:当模型成为一个用户,产品该如何重写。


关键词: MCP, Model Context Protocol, AI Agent, 模型自主性, Anthropic

事实核查备注: 演讲者:Theodora Chu(Anthropic MCP 产品经理);协议名称:Model Context Protocol(MCP);关键公司:Anthropic、Google、Microsoft、OpenAI;关键产品:Claude、Cursor;关键技术点:上下文窗口、tool calling、streamable HTTP、SSE、OAuth、elicitation;时间节点:2024年11月 Hack Week 开源 MCP;核心观点:服务器数量将多于客户端、Agent 是未来