为什么顶级AI Agent都抛弃框架,回归原语
正在加载视频...
视频章节
Ahmad Awais用一次现场“vibe coding”演示,讲清了一个反直觉结论:真正跑在生产环境里的AI Agent,几乎都不是用框架搭出来的,而是直接基于AI原语。本文还原他的技术判断、个人经历,以及一套可复用的Agent构建方法论。
为什么顶级AI Agent都抛弃框架,回归原语
Ahmad Awais用一次现场“vibe coding”演示,讲清了一个反直觉结论:真正跑在生产环境里的AI Agent,几乎都不是用框架搭出来的,而是直接基于AI原语。本文还原他的技术判断、个人经历,以及一套可复用的Agent构建方法论。
从“和PDF聊天”开始的反常识结论
为什么这很重要?因为几乎所有人一开始做AI Agent,都会先找一个“现成框架”。Ahmad Awais一上来就反其道而行之,在演讲现场边讲边“vibe code”了一个最常见的Agent:和PDF对话。
这个演示看起来并不复杂:上传一份PDF,构建向量存储,用大语言模型(LLM)来回答问题。Ahmad刻意强调了一点:这个Agent不是基于任何AI框架,而是直接用AI primitives(原语)拼出来的。他说得很直白:“所有这些LLM本质上都是自注意力算法,那为什么我们要把事情搞复杂?”
在他看来,像“chat with your data”这种Agent已经是生产环境里的常态,而决定成败的不是你用了多高级的抽象,而是你是否清楚自己真正需要的最小能力集合:存储、检索、推理、对话状态。这个现场Demo的价值不在功能,而在于它直接引出了整场演讲的核心命题。
顶级产品的共同点:它们几乎都不用AI框架
为什么这值得认真对待?因为Ahmad点名的不是实验项目,而是真正被数百万人使用的产品。他列举了Perplexity、Cursor、Lovable、Bolt,甚至包括他自己正在做的CHAI。
他的结论非常尖锐:“你会发现一个共同点:这些生产级AI Agent,并不是构建在AI框架之上。”原因也很直接——框架臃肿、演进缓慢、充满了“没人真正需要的抽象”。这些问题在快速变化的AI领域会被无限放大。
相反,他主张回到AI primitives:可组合、低层、稳定的小能力模块。这不是新思想。Ahmad用Amazon S3做类比:S3不是一个“对象存储框架”,而是一个极其简单的上传和下载原语,却支撑了整个AWS生态。他的原话是:“它不是框架,它是一个低层原语,但你可以用它构建几乎一切。”
这也是他整场演讲最核心的一句话之一:“It’s much better to build on top of primitives instead of building on top of a pre-built abstraction.”
一个“反框架者”的成长史
为什么他的判断值得听?因为Ahmad并不是站在框架之外批评框架的人。他花了相当长的篇幅讲自己的背景:如果你用过WordPress、Next.js、Node.js、React,你“很可能已经在用他的代码”。
他创建和维护了数百个开源项目,包括自动化CLI工具和“Shades of Purple”代码主题,年下载量达到四五千万次;他曾参与NASA直升机任务的代码;做过开发者工具VP、工程VP,还是Google开发者顾问委员会成员。
更关键的是他在LLM上的时间点。2020年,Greg Brockman亲自给了他GPT‑3的早期访问权限。当时模型“可能才发布了一个月”,他已经在尝试构建类似GitHub Copilot的产品,而Copilot是在一年后的2021年才正式发布。
正是这些经历,让他得出一个略带疲惫但极其真实的判断:“构建、部署、扩展AI Agent,至今仍然是最大的痛点。”他说这话时,语气更像一个走过弯路的人,而不是布道者。
AI Agent不是新物种,而是新的“写代码方式”
为什么这会影响每个工程师?因为Ahmad对AI Agent的定义,本身就在拆掉框架思维。他说:“AI agents are just a new way of writing code.”它不是一个可以被完整装进框架的东西,而是一种足够大的编程范式变化。
基于这个判断,他提出应当围绕“通用原语”来构建Agent系统。比如,几乎每个Agent都需要对话历史和上下文,于是“threads(线程)”就成为一个非常合理的原语。它不关心你用什么模型,也不关心你做什么业务,但所有Agent都会用到。
在技术结构上,他系统性地梳理了几种常见Agent架构:最基础的是Augmented LLM(增强型大模型),通过外部工具和记忆扩展模型能力;再往上是并行Agent、Evaluator-Optimizer(评估-优化)模式等。这些并不是框架,而是“可重复的原语组合模式”。
他的结论非常务实:“掌握这些原语模式,你就能构建市面上80%最复杂的AI Agents。”这不是降低门槛,而是把注意力从框架选择,拉回到系统设计本身。
总结
Ahmad Awais这场演讲的真正价值,不在于“反对框架”,而在于提醒工程师重新思考抽象的边界。在一个模型、工具、范式高速变化的时代,稳定、低层、可组合的AI原语,反而更接近长期生产价值。对正在转型为AI工程师的人来说,这不仅是技术选择,更是一种构建思维的转向。
关键词: AI Agent, AI Primitives, 大语言模型, 向量数据库, 生产级AI
事实核查备注: 演讲者:Ahmad Awais;提及人物:Greg Brockman;模型:GPT-3;产品:GitHub Copilot、Perplexity、Cursor;公司:Amazon、Google;核心概念:AI primitives、Augmented LLM、向量存储、对话线程;时间点:GPT-3早期访问于2020年,Copilot发布于2021年