为什么顶级AI Agent都抛弃框架，回归原语

AI PM 编辑部 · 2025年06月03日 · 23 阅读 · AI/人工智能

Greg Brockman 注意力机制对话AI AI Agent 模型部署向量数据库大语言模型 GitHub Copilot Perplexity Cursor

正在加载视频...

视频章节

Ahmad Awais用一次现场“vibe coding”演示，讲清了一个反直觉结论：真正跑在生产环境里的AI Agent，几乎都不是用框架搭出来的，而是直接基于AI原语。本文还原他的技术判断、个人经历，以及一套可复用的Agent构建方法论。

为什么顶级AI Agent都抛弃框架，回归原语

Ahmad Awais用一次现场“vibe coding”演示，讲清了一个反直觉结论：真正跑在生产环境里的AI Agent，几乎都不是用框架搭出来的，而是直接基于AI原语。本文还原他的技术判断、个人经历，以及一套可复用的Agent构建方法论。

从“和PDF聊天”开始的反常识结论

为什么这很重要？因为几乎所有人一开始做AI Agent，都会先找一个“现成框架”。Ahmad Awais一上来就反其道而行之，在演讲现场边讲边“vibe code”了一个最常见的Agent：和PDF对话。

这个演示看起来并不复杂：上传一份PDF，构建向量存储，用大语言模型（LLM）来回答问题。Ahmad刻意强调了一点：这个Agent不是基于任何AI框架，而是直接用AI primitives（原语）拼出来的。他说得很直白：“所有这些LLM本质上都是自注意力算法，那为什么我们要把事情搞复杂？”

在他看来，像“chat with your data”这种Agent已经是生产环境里的常态，而决定成败的不是你用了多高级的抽象，而是你是否清楚自己真正需要的最小能力集合：存储、检索、推理、对话状态。这个现场Demo的价值不在功能，而在于它直接引出了整场演讲的核心命题。

顶级产品的共同点：它们几乎都不用AI框架

为什么这值得认真对待？因为Ahmad点名的不是实验项目，而是真正被数百万人使用的产品。他列举了Perplexity、Cursor、Lovable、Bolt，甚至包括他自己正在做的CHAI。

他的结论非常尖锐：“你会发现一个共同点：这些生产级AI Agent，并不是构建在AI框架之上。”原因也很直接——框架臃肿、演进缓慢、充满了“没人真正需要的抽象”。这些问题在快速变化的AI领域会被无限放大。

相反，他主张回到AI primitives：可组合、低层、稳定的小能力模块。这不是新思想。Ahmad用Amazon S3做类比：S3不是一个“对象存储框架”，而是一个极其简单的上传和下载原语，却支撑了整个AWS生态。他的原话是：“它不是框架，它是一个低层原语，但你可以用它构建几乎一切。”

这也是他整场演讲最核心的一句话之一：“It’s much better to build on top of primitives instead of building on top of a pre-built abstraction.”

一个“反框架者”的成长史

为什么他的判断值得听？因为Ahmad并不是站在框架之外批评框架的人。他花了相当长的篇幅讲自己的背景：如果你用过WordPress、Next.js、Node.js、React，你“很可能已经在用他的代码”。

他创建和维护了数百个开源项目，包括自动化CLI工具和“Shades of Purple”代码主题，年下载量达到四五千万次；他曾参与NASA直升机任务的代码；做过开发者工具VP、工程VP，还是Google开发者顾问委员会成员。

更关键的是他在LLM上的时间点。2020年，Greg Brockman亲自给了他GPT‑3的早期访问权限。当时模型“可能才发布了一个月”，他已经在尝试构建类似GitHub Copilot的产品，而Copilot是在一年后的2021年才正式发布。

正是这些经历，让他得出一个略带疲惫但极其真实的判断：“构建、部署、扩展AI Agent，至今仍然是最大的痛点。”他说这话时，语气更像一个走过弯路的人，而不是布道者。

AI Agent不是新物种，而是新的“写代码方式”

为什么这会影响每个工程师？因为Ahmad对AI Agent的定义，本身就在拆掉框架思维。他说：“AI agents are just a new way of writing code.”它不是一个可以被完整装进框架的东西，而是一种足够大的编程范式变化。

基于这个判断，他提出应当围绕“通用原语”来构建Agent系统。比如，几乎每个Agent都需要对话历史和上下文，于是“threads（线程）”就成为一个非常合理的原语。它不关心你用什么模型，也不关心你做什么业务，但所有Agent都会用到。

在技术结构上，他系统性地梳理了几种常见Agent架构：最基础的是Augmented LLM（增强型大模型），通过外部工具和记忆扩展模型能力；再往上是并行Agent、Evaluator-Optimizer（评估-优化）模式等。这些并不是框架，而是“可重复的原语组合模式”。

他的结论非常务实：“掌握这些原语模式，你就能构建市面上80%最复杂的AI Agents。”这不是降低门槛，而是把注意力从框架选择，拉回到系统设计本身。

总结

Ahmad Awais这场演讲的真正价值，不在于“反对框架”，而在于提醒工程师重新思考抽象的边界。在一个模型、工具、范式高速变化的时代，稳定、低层、可组合的AI原语，反而更接近长期生产价值。对正在转型为AI工程师的人来说，这不仅是技术选择，更是一种构建思维的转向。

关键词： AI Agent， AI Primitives，大语言模型，向量数据库，生产级AI

事实核查备注：演讲者：Ahmad Awais；提及人物：Greg Brockman；模型：GPT-3；产品：GitHub Copilot、Perplexity、Cursor；公司：Amazon、Google；核心概念：AI primitives、Augmented LLM、向量存储、对话线程；时间点：GPT-3早期访问于2020年，Copilot发布于2021年

返回文章列表