给 AI Agent 塞更多上下文，反而更蠢？她揭开了一个反直觉真相

AI PM 编辑部 · 2026年06月08日 · 9 阅读 · AI/人工智能

正在加载视频...

视频章节

你以为 Agent 不聪明，是因为“上下文不够多”。但在真实系统里，更多上下文往往让结果更糟。来自 Qodo 的 Nupur Sharma 用一线踩坑经验告诉你：不是模型不行，而是我们喂错了东西。

给 AI Agent 塞更多上下文，反而更蠢？她揭开了一个反直觉真相

你以为 Agent 不聪明，是因为“上下文不够多”。但在真实系统里，更多上下文往往让结果更糟。来自 Qodo 的 Nupur Sharma 用一线踩坑经验告诉你：不是模型不行，而是我们喂错了东西。

最反直觉的一刀：上下文不是越多越好

在这场分享里，Nupur Sharma 抛出了一个几乎所有 AI 工程师都会下意识反对的观点：Context 本身不是问题，乱给 Context 才是问题。她观察到一个典型的 U 型曲线——在上下文很少时，Agent 表现不好；在上下文适中时，效果最好；但一旦你开始“疯狂加料”，模型反而开始忽略中间那一大段信息。

更扎心的是，这不是主观感觉，而是他们在真实系统里做 benchmark 得出的结论。LLM 会主动“清理”它觉得不重要、甚至妨碍理解的信息，试图自己构建一套能说得通的世界观。结果就是：你精心准备的中间说明，被模型当成噪音直接丢掉。

从确定性世界走来，她为什么对 Agent 如此警惕

Nupur 的背景并不是“纯 AI 研究员”，而是 DevSecOps——一个高度确定性的工程世界：规则清晰、结果可复现、对错分明。正是这种对确定性的执念，让她在 Agent 系统里迅速意识到问题。

当 Agent 从“静态 Prompt”进化为多角色、多步骤协作时，一个新的麻烦出现了：不同 Agent 之间对上下文的理解会发生冲突。它们各自“觉得自己懂了”，但拼在一起却得不到可用结果。这不是模型能力不足，而是我们在设计时默认了一个错误前提：所有 Agent 会以同样的方式理解同一段上下文。现实狠狠打脸。

Context Optimization：不是多给，而是给对

那怎么办？Nupur 给出的方向不是“更强的模型”，而是更聪明的上下文策略。她强调，Context Optimization 并不意味着开发者要在一开始就投入大量精力写复杂规则，而是通过策略化设计，让系统自己学会：什么该保留，什么该丢弃。

这背后有一个重要判断：并不是所有决策都需要最强模型来做。她提到所谓的“orchestration paradox”——如果你用最强模型去做所有编排决策，系统复杂度和成本都会失控。相反，那些 20% 难度的决策，完全可以交给更轻量的模型处理，把重型模型留给真正需要推理深度的地方。

Judge Agent：当上下文不可避免地爆炸

在一些不可避免会产生大量上下文的场景（比如复杂代码审查），他们引入了一个“Judge Agent”。它不直接参与生成，而是负责整合、裁剪、裁决多个 Agent 的输出。

这个角色的价值在于：当你已经有了很多“看似合理、但互相打架”的结果时，Judge Agent 能把它们压缩成一个“对人类有意义”的结论。这套思路已经被用在 Qodo 的代码审查架构中，通过不断 refine 输出，让最终结果不只是正确，而是可用。

总结

这场分享真正戳中人的地方在于：它没有鼓吹更大的模型、更长的 Prompt，而是逼你重新思考 Agent 设计的基本假设。对 AI 从业者来说，最大的 takeaway 是——Agent 的智能上限，往往不是模型决定的，而是上下文管理决定的。下次你想“再加点说明试试”之前，不妨先问自己：这段信息，真的会被需要吗？还是只是让系统更混乱？未来的竞争力，很可能不在于谁能喂得最多，而在于谁能喂得最克制。

关键词： AI Agent，上下文优化，提示工程，大语言模型， Agent 架构

事实核查备注：需要核查：演讲者姓名 Nupur Sharma 的职位与公司拼写（Qodo / Kodo）；演讲中提到的 benchmark 是否有公开数据；“20% model”是否为原话或比喻；Judge Agent 是否为正式命名还是概念性描述

返回文章列表