为什么Agent的大脑需要一本“作战手册”：从本体论到Graph RAG的实战收益

AI PM 编辑部 · 2025年06月27日 · 20 阅读 · AI/人工智能

检索增强生成 AI应用向量数据库大语言模型 LangChain LlamaIndex

正在加载视频...

视频章节

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点：要让 AI Agent 更可靠，关键不只是更大的模型，而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG，他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

为什么Agent的大脑需要一本“作战手册”：从本体论到Graph RAG的实战收益

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点：要让 AI Agent 更可靠，关键不只是更大的模型，而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG，他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

Graph RAG 为什么值得你放下向量数据库再看一眼

为什么我们需要重新审视 RAG 架构？Barrasa 一开场就点出了问题的核心：当 AI 应用开始承载真实业务决策时，“差不多相关”已经不够了。Graph RAG 的价值，正在于它把检索从“相似度游戏”升级为“语义理解”。

他用一句非常直接的话概括 Graph RAG：这是一个“用知识图谱替换向量数据库的 RAG”。流程并没有变——用户提问、系统检索、再交给大语言模型生成答案——但检索的对象变成了一个“受控、策划过、可信的知识库”。这个知识库不是一堆 embedding，而是一个建立在图数据库之上的知识图谱。

Barrasa 强调，收益并不抽象。他明确列出了 Graph RAG 带来的改进：更高的结果质量（quality）、更好的完整性（completeness）、更强的相关性（relevance）、更高的精度（precision），以及对事实更忠实（faithfulness）。这些词不是营销话术，而是来自一线落地后的真实对比。

在他看来，当你开始关心“答案是不是漏了关键关系”“是不是把不该连在一起的概念混在一起”，那就是向量检索的天然短板，而图结构恰恰擅长解决这些问题。

从 Property Graph 到 Graph RAG：真正复杂的不是建图，而是对齐认知

为什么很多团队在 Graph RAG 上卡住？Barrasa 很坦诚：问题往往不在数据库，而在“我们到底想表达什么”。Neo4j 使用的是 property graph 模型，只有两种核心原语：节点（nodes）和关系（relationships）。看似简单，但真正的复杂性来自语义。

在典型的 Graph RAG 架构中，文档会被切成 chunks，这些 chunks 本身也可以是图中的节点，并通过实体抽取与领域图（domain graph）相连。同时，它们仍然可以保留向量表示，用于混合检索。Barrasa 特别强调一句话：“这些 chunks 不只是文本碎片，而是被图连接起来的上下文载体。”

问题随之而来：当你通过 LangChain 或 LlamaIndex 把 schema 注入到抽取流程中时，这个 schema 往往是为某一个实现、某一个工具临时设计的。Barrasa 称这种情况为一种“divergence（发散）”——你的知识结构开始被工具牵着走，而不是由业务本身决定。

这正是他后面要引入本体论的铺垫：如果没有一个稳定的、共享的语义基础，图会越来越大，但也越来越难维护。

本体论不是学术包袱，而是让团队不再反复踩坑的“共享语言”

为什么本体论在 AI 工程里被低估？Barrasa 给出的定义非常朴素：“本体论只是对一个领域的共享描述。”它不等于实现，不绑定数据库，也不属于某个框架。

他展示了一个 fiber ontology 的片段，用来说明本体论如何在实现之前，先统一概念边界。哪些是实体，哪些是关系，哪些属性是必须的——这些问题如果不提前说清楚，就会在后期以 schema 冲突、抽取失败、查询混乱的形式反复出现。

一个关键洞见是：本体论提供的是一种“implementation-agnostic”的方式来驱动知识图谱的创建。你今天可以用 Neo4j，明天可以换工具，但语义层不需要推倒重来。Barrasa 直言，这种前期投入“will pay dividends in the long run（长期一定会有回报）”。

更重要的是，本体论让知识建模不再是某个工程师脑子里的隐性知识，而变成团队可讨论、可演进的资产。这在 Agent 场景下尤其关键，因为 Agent 的“理解方式”直接决定了它的行为边界。

不只是建图：本体论如何直接改变检索与 Agent 行为

为什么本体论不只是建模工具，而是运行时工具？Barrasa 在检索阶段给出了一个非常实用的思路：让本体论参与检索决策本身。

在 Graph RAG 的检索侧，你并不只是“查哪些节点相似”，而是在创建一个新的搜索空间。通过本体论，你可以限制或引导检索路径，比如：哪些类型的关系是合法的，哪些实体组合根本不应该被一起返回。

他明确提到一个做法：“drive the behavior of my retriever by consulting the ontology（通过查询本体论来驱动检索器的行为）。”这意味着，Agent 在找资料之前，就已经知道什么是‘合理的世界结构’。

这种做法带来的不是一点点性能提升，而是额外的‘richness’——LLM 拿到的是已经被语义约束过的上下文，而不是一堆事后才试图自洽的文本。对于需要稳定、可解释行为的 AI Agent 来说，这几乎是一种必需品。

总结

Barrasa 在最后总结了两个 takeaways：第一，Graph RAG 的真正价值不在“图”本身，而在语义结构；第二，本体论是让这种结构可持续演进的关键。对正在构建 AI Agent 的团队来说，这场分享的启发非常直接：如果你希望 Agent 像一个受过训练的专家，而不是即兴发挥的实习生，那么你需要的不只是更聪明的模型，而是一套清晰、共享、可执行的知识作战手册。

关键词： Graph RAG，本体论，知识图谱，大语言模型， AI Agent

事实核查备注： Jesús Barrasa：Neo4j Field CTO for AI；Graph RAG：以知识图谱替代向量数据库的 RAG 架构；Property Graph：由节点和关系构成；相关工具：LangChain、LlamaIndex；核心概念：Ontology（本体论）、Knowledge Graph、Large Language Models

返回文章列表