MCP的真正野心：让大模型“走出对话框”

AI PM 编辑部 · 2025年06月18日 · 18 阅读 · AI/人工智能

AI安全代码生成 AI应用大语言模型 AI Agent 上下文窗口 Cursor Claude Microsoft OpenAI

正在加载视频...

视频章节

Anthropic 产品经理 Theodora Chu 亲述 MCP 的起源与野心：它并不是又一个工具调用协议，而是一场围绕“模型自主性”的长期赌注。从工程师反复复制上下文的痛点，到 Cursor、Google、OpenAI 的集体采用，这次演讲给了创业者非常具体的判断框架：接下来该往哪里建。

MCP的真正野心：让大模型“走出对话框”

Anthropic 产品经理 Theodora Chu 亲述 MCP 的起源与野心：它并不是又一个工具调用协议，而是一场围绕“模型自主性”的长期赌注。从工程师反复复制上下文的痛点，到 Cursor、Google、OpenAI 的集体采用，这次演讲给了创业者非常具体的判断框架：接下来该往哪里建。

从复制粘贴到模型自主性：MCP诞生的真实起点

理解 MCP，必须从一个极其“工程师日常”的痛点开始。Theodora Chu 回忆，MCP 的最初灵感来自两位工程师 David 和 Justin 的反复吐槽：他们在使用大模型时，不断把 Slack 消息、Sentry 报错、外部文档复制进上下文窗口。“你突然想起来，有一条 Slack 消息其实特别重要，于是只能手动拷进去。”

这个动作本身暴露了一个更深层的问题：模型被困在对话框里。Chu 用了一个非常形象的说法——他们希望 Claude 或任何 LLM 能“爬出盒子，伸手到现实世界中，把上下文和行动一起带回来”。这不仅是上下文的问题，而是“模型是否拥有行动能力（model agency）”。

也正是这个判断，决定了 MCP 从一开始就不是 Anthropic 的私有接口，而是一个必须开源、标准化的协议。Chu 直言，如果这是一个封闭生态，那么任何集成都要先走 BD、对齐接口、再开发，根本无法规模化。而他们认为，真正阻碍 LLM 进入下一个阶段的，不是推理能力，而是“是否被允许行动”。

为什么一定要是开源协议？以及一次并不被理解的发布

MCP 的第一个转折点发生在 2024 年 11 月的 Anthropic Hack Week。一个内部“tiger team”把协议做出来后，工程师们开始用 MCP 自动化自己的工作流，甚至跨团队使用。Chu 形容那一刻很像“从两个工程师在车库里，一下子走到了一个真正有价值的节点”。

但真正对外开源后，现实却并不浪漫。发布初期，团队反复听到的不是赞美，而是困惑：“什么是 MCP？”、“为什么需要一个新协议？”、“模型不是已经能调用工具了吗？”Chu 很坦诚地说，大多数 0 到 1 的产品，发布那一刻其实并不重要。

真正的拐点，是 Cursor 率先采用 MCP，随后 VS Code、Sourcegraph 等编码工具跟进。再往后，Google、Microsoft、OpenAI 的加入，让 MCP 开始具备‘标准’的雏形。但 Chu 特别强调一句话：“标准之所以成为标准，是因为它真的对开发者有用。”因此她公开邀请开发者提 issue、提 PR，甚至直接修协议本身——MCP 必须被社区持续“折磨”，才有价值。

为Agent而生的设计取舍：为什么让客户端更痛苦？

如果说 MCP 的核心赌注是什么，Chu 的答案非常清晰：Agent 是未来。她几乎预言式地说，“你们接下来会在每一场演讲里听到 agents 这个词。”但 MCP 对 agent 的理解并不是“多写几个 prompt”，而是：你要相信模型会自己选择行动。

正因为如此，MCP 在协议设计上做了几个颇具争议的决定。比如从 SSE 转向 streamable HTTP 作为主要传输方式。Chu 承认这在当时“非常有争议”，但原因很现实：如果 agent 之间需要双向通信，SSE 并不合适。

另一个关键判断是：未来 MCP 生态里，服务器会远多于客户端。基于这个假设，团队在所有权衡中都优先简化服务器，而把复杂性推给客户端。Chu 半开玩笑地向客户端开发者道歉，但也强调这是一个“非常刻意的决定”。这些取舍背后，本质上都是在为模型智能不断提升后的世界提前铺路。

过去六个月的修正与进化：社区正在重塑MCP

MCP 并不是一条直线式前进的协议。Chu 在演讲中罕见地公开承认：“我们一开始把 OAuth 做错了。”这个问题最终并不是内部修好的，而是社区成员根据真实身份系统的运作方式，直接参与修改了 draft spec。

除了 OAuth，过去半年 MCP 还支持了 remote MCP、正式切换到 streamable HTTP，并更新了 SDK 和 Inspector（一个被 Chu 称为“严重被低估”的调试工具）。更重要的是，协议开始围绕 agent 体验继续扩展，比如新增的 elicitation 机制。

她举了一个非常具体的例子：当用户说“帮我订去亚特兰大的最佳航班”时，服务器可以反问“最佳是最便宜还是最快？”，并把用户的回答重新传回。这看似细小，却是模型真正参与决策闭环的关键一步。

给创业者的答案：80%的机会，在“更好的服务器”

在演讲的最后，Chu 回答了她被问得最多的问题：“如果 MCP 成为标准，我该做什么？”她的答案非常不平均：80% 的机会在构建高质量 MCP 服务器，10% 在简化服务器构建工具，10% 是更激进的未来押注。

她对“高质量”的定义很尖锐：不是把现有 API 一比一包成工具。因为 MCP 服务器有三个用户——终端用户、客户端开发者，以及“模型本身”。很多人忘了，模型也是用户。你必须反过来思考：用户会怎么提问？模型需要哪些工具，才能正确回答？

此外，她明确希望 MCP 走出开发者工具，进入销售、金融、法律、教育等垂直领域。至于更激进的方向，她提到“自动生成 MCP 服务器”：当模型足够聪明时，它们将能实时为自己写 MCP。最后，她也提醒，随着模型越来越能“触达现实世界”，安全、审计和可观测性将成为不可回避的创业方向。

总结

这场演讲最有价值的地方，并不在于 MCP 的具体接口，而在于它背后的判断：大模型真正的下一步，不是更长的上下文，而是被允许行动。MCP 是一次提前下注，赌模型会越来越聪明，也赌开发者愿意为此构建基础设施。对创业者而言，机会并不在“追风口”，而在于是否真的理解：当模型成为一个用户，产品该如何重写。

关键词： MCP， Model Context Protocol， AI Agent，模型自主性， Anthropic

事实核查备注：演讲者：Theodora Chu（Anthropic MCP 产品经理）；协议名称：Model Context Protocol（MCP）；关键公司：Anthropic、Google、Microsoft、OpenAI；关键产品：Claude、Cursor；关键技术点：上下文窗口、tool calling、streamable HTTP、SSE、OAuth、elicitation；时间节点：2024年11月 Hack Week 开源 MCP；核心观点：服务器数量将多于客户端、Agent 是未来

返回文章列表