正在加载视频...
视频章节
这场演讲从一个现实问题出发:在复杂、密集的企业知识中,单纯依赖向量检索的RAG正在失效。Sam Julien结合真实系统演进过程,讲述了他们为何转向Graph-based RAG,以及这一转折带来的方法论启示。
当向量失效:企业级知识为何逼着RAG走向图结构
这场演讲从一个现实问题出发:在复杂、密集的企业知识中,单纯依赖向量检索的RAG正在失效。Sam Julien结合真实系统演进过程,讲述了他们为何转向Graph-based RAG,以及这一转折带来的方法论启示。
为什么“向量不够用了”:一个行业正在显现的信号
这一节最重要的价值在于背景判断:为什么Graph-based RAG不再只是“前沿尝试”,而是正在成为刚需。演讲一开始,Sam Julien就点出一个耐人寻味的信号——大会里出现了一个完整的“Graph-based RAG”专题轨道。他直言不讳地说:“vector search is just not enough for RAG at scale。”这并不是对向量检索本身的否定,而是对应用场景变化的回应。
在企业内部,知识往往高度密集、强关联、跨文档且不断演化。向量Embedding擅长的是“语义相似度”,却不擅长表达显式关系、层级结构和因果链条。当问题变得复杂,比如需要同时理解多个实体、规则和历史决策时,向量检索返回的只是“像不像”,而不是“怎么连在一起”。Sam 将这种现象描述为:系统在小规模演示中表现很好,但一旦扩展到真实业务,就开始出现不可解释、不可复现的失败。
这个判断构成了整场演讲的逻辑起点:Graph-based RAG并不是为了更酷,而是为了解决“向量在企业知识中失灵”的结构性问题。
从Embedding到系统瓶颈:一次并不意外的碰壁
理解转向图结构之前,先要看清他们踩过的坑。Sam 回顾了系统的早期设计:和大多数团队一样,他们最初选择了向量Embedding作为核心检索方式,把文本切分、向量化,然后通过相似度搜索喂给大模型。这条路径在行业中几乎是默认选项。
但问题很快出现了。他提到,“the problem that we are trying to solve kind of constantly”,核心并不在模型能力,而在系统整体的可控性。向量检索返回的结果缺乏稳定性,不同查询、不同Embedding版本,都会导致上下文发生微妙但致命的变化。更棘手的是,当结果出错时,工程团队很难回答“为什么是这些文档”。
另一个关键挑战在于数据形态。企业知识并非只有自然语言文本,还包括结构化字段、配置、规则甚至JSON对象。Embedding可以把它们‘压扁’成向量,但这种压缩同时抹掉了原本对业务至关重要的结构信息。正是这些持续出现、且无法通过简单调参解决的问题,把他们一步步推向了Graph-based RAG。
走向Graph-based RAG:不是灵丹妙药,而是四个新难题
转向图结构并不意味着问题立刻消失。Sam 很坦诚地说:“there were four things that we ran into.”虽然演讲中没有把每一点都包装成结论,但可以清楚感受到这是一段反复试错的过程。
首先是建模成本。图结构要求团队明确实体、关系和边界,这迫使工程师和领域专家坐下来,把“隐含知识”说清楚。其次是查询复杂度,图查询本身就比向量相似度搜索更难设计。第三是与大模型的接口问题——如何把图中检索到的多跳结果,转化为模型真正能用的上下文。最后是评估:当系统变得更复杂,传统的RAG评测方式开始失效。
这些挑战并没有让团队后退,反而促使他们在方法上更谨慎。Sam 强调,Graph-based RAG的价值不在于“替代向量”,而在于为推理提供显式结构。这是一种能力取舍,而不是技术站队。
回到研究本身:RAG不是技巧,而是一整套系统设计
演讲后半段最耐人寻味的,是团队如何“回到原点”。Sam 提到,他们重新阅读了最初的RAG论文,重新审视fusion和decoder这些在实践中常被忽略的概念。他特别提到一种思路:不是简单拼接检索结果,而是让模型在结构化上下文中进行融合。
在具体实践上,他们尝试对模型进行微调(fine-tuning),并将数据点以JSON等结构化格式存储,而不是纯文本。这使得模型在生成时,能够感知字段含义,而不只是词序。Sam 还提到,通过这种方式,“we can actually expose the thought”,也就是让系统的中间推理过程更可见、更可调试。
这一节的核心洞见在于:真正可扩展的RAG系统,必须同时设计好检索、表示和生成三个层面。图结构只是其中一环,但它迫使团队把系统当成系统,而不是模型的附属品。
总结
Sam Julien 的分享并没有给出一个“万能架构”,而是提供了一条清晰的判断路径:当你的RAG开始在企业级复杂知识中失控时,问题很可能不在模型,而在表示方式。Graph-based RAG的价值,在于把关系、结构和约束重新带回检索层。这对读者最大的启发是:不要迷信单一技术栈,而要根据知识密度和推理需求,重新思考系统边界。
关键词: Graph-based RAG, 向量检索, 企业知识, Embedding, 检索增强生成
事实核查备注: 视频标题:When Vectors Break Down: Graph-Based RAG for Dense Enterprise Knowledge;演讲者:Sam Julien;核心原话引用包括“vector search is just not enough for RAG at scale”“there were four things that we ran into”“we can actually expose the thought”;涉及技术名词:Embedding、Graph-based RAG、RAG、fine-tuning、JSON结构化数据。