为什么Agent的大脑需要一本“作战手册”:从本体论到Graph RAG的实战收益

AI PM 编辑部 · 2025年06月27日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点:要让 AI Agent 更可靠,关键不只是更大的模型,而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG,他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

为什么Agent的大脑需要一本“作战手册”:从本体论到Graph RAG的实战收益

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点:要让 AI Agent 更可靠,关键不只是更大的模型,而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG,他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

Graph RAG 为什么值得你放下向量数据库再看一眼

为什么我们需要重新审视 RAG 架构?Barrasa 一开场就点出了问题的核心:当 AI 应用开始承载真实业务决策时,“差不多相关”已经不够了。Graph RAG 的价值,正在于它把检索从“相似度游戏”升级为“语义理解”。

他用一句非常直接的话概括 Graph RAG:这是一个“用知识图谱替换向量数据库的 RAG”。流程并没有变——用户提问、系统检索、再交给大语言模型生成答案——但检索的对象变成了一个“受控、策划过、可信的知识库”。这个知识库不是一堆 embedding,而是一个建立在图数据库之上的知识图谱。

Barrasa 强调,收益并不抽象。他明确列出了 Graph RAG 带来的改进:更高的结果质量(quality)、更好的完整性(completeness)、更强的相关性(relevance)、更高的精度(precision),以及对事实更忠实(faithfulness)。这些词不是营销话术,而是来自一线落地后的真实对比。

在他看来,当你开始关心“答案是不是漏了关键关系”“是不是把不该连在一起的概念混在一起”,那就是向量检索的天然短板,而图结构恰恰擅长解决这些问题。

从 Property Graph 到 Graph RAG:真正复杂的不是建图,而是对齐认知

为什么很多团队在 Graph RAG 上卡住?Barrasa 很坦诚:问题往往不在数据库,而在“我们到底想表达什么”。Neo4j 使用的是 property graph 模型,只有两种核心原语:节点(nodes)和关系(relationships)。看似简单,但真正的复杂性来自语义。

在典型的 Graph RAG 架构中,文档会被切成 chunks,这些 chunks 本身也可以是图中的节点,并通过实体抽取与领域图(domain graph)相连。同时,它们仍然可以保留向量表示,用于混合检索。Barrasa 特别强调一句话:“这些 chunks 不只是文本碎片,而是被图连接起来的上下文载体。”

问题随之而来:当你通过 LangChain 或 LlamaIndex 把 schema 注入到抽取流程中时,这个 schema 往往是为某一个实现、某一个工具临时设计的。Barrasa 称这种情况为一种“divergence(发散)”——你的知识结构开始被工具牵着走,而不是由业务本身决定。

这正是他后面要引入本体论的铺垫:如果没有一个稳定的、共享的语义基础,图会越来越大,但也越来越难维护。

本体论不是学术包袱,而是让团队不再反复踩坑的“共享语言”

为什么本体论在 AI 工程里被低估?Barrasa 给出的定义非常朴素:“本体论只是对一个领域的共享描述。”它不等于实现,不绑定数据库,也不属于某个框架。

他展示了一个 fiber ontology 的片段,用来说明本体论如何在实现之前,先统一概念边界。哪些是实体,哪些是关系,哪些属性是必须的——这些问题如果不提前说清楚,就会在后期以 schema 冲突、抽取失败、查询混乱的形式反复出现。

一个关键洞见是:本体论提供的是一种“implementation-agnostic”的方式来驱动知识图谱的创建。你今天可以用 Neo4j,明天可以换工具,但语义层不需要推倒重来。Barrasa 直言,这种前期投入“will pay dividends in the long run(长期一定会有回报)”。

更重要的是,本体论让知识建模不再是某个工程师脑子里的隐性知识,而变成团队可讨论、可演进的资产。这在 Agent 场景下尤其关键,因为 Agent 的“理解方式”直接决定了它的行为边界。

不只是建图:本体论如何直接改变检索与 Agent 行为

为什么本体论不只是建模工具,而是运行时工具?Barrasa 在检索阶段给出了一个非常实用的思路:让本体论参与检索决策本身。

在 Graph RAG 的检索侧,你并不只是“查哪些节点相似”,而是在创建一个新的搜索空间。通过本体论,你可以限制或引导检索路径,比如:哪些类型的关系是合法的,哪些实体组合根本不应该被一起返回。

他明确提到一个做法:“drive the behavior of my retriever by consulting the ontology(通过查询本体论来驱动检索器的行为)。”这意味着,Agent 在找资料之前,就已经知道什么是‘合理的世界结构’。

这种做法带来的不是一点点性能提升,而是额外的‘richness’——LLM 拿到的是已经被语义约束过的上下文,而不是一堆事后才试图自洽的文本。对于需要稳定、可解释行为的 AI Agent 来说,这几乎是一种必需品。

总结

Barrasa 在最后总结了两个 takeaways:第一,Graph RAG 的真正价值不在“图”本身,而在语义结构;第二,本体论是让这种结构可持续演进的关键。对正在构建 AI Agent 的团队来说,这场分享的启发非常直接:如果你希望 Agent 像一个受过训练的专家,而不是即兴发挥的实习生,那么你需要的不只是更聪明的模型,而是一套清晰、共享、可执行的知识作战手册。


关键词: Graph RAG, 本体论, 知识图谱, 大语言模型, AI Agent

事实核查备注: Jesús Barrasa:Neo4j Field CTO for AI;Graph RAG:以知识图谱替代向量数据库的 RAG 架构;Property Graph:由节点和关系构成;相关工具:LangChain、LlamaIndex;核心概念:Ontology(本体论)、Knowledge Graph、Large Language Models