Knowledge Graph Mullet：用混合图思维修剪GraphRAG复杂度

AI PM 编辑部 · 2025年06月03日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

这场演讲中，William Lyon提出了一个颇具画面感的概念——“Knowledge Graph Mullet”，用混合知识图谱的方式，解决GraphRAG在真实应用中过于复杂的问题。通过结合RDF与属性图、Dgraph与DQL，以及具体的新闻数据与AI Agent示例，他展示了一条更可落地的知识图谱+生成式AI路径。

Knowledge Graph Mullet：用混合图思维修剪GraphRAG复杂度

这场演讲中，William Lyon提出了一个颇具画面感的概念——“Knowledge Graph Mullet”，用混合知识图谱的方式，解决GraphRAG在真实应用中过于复杂的问题。通过结合RDF与属性图、Dgraph与DQL，以及具体的新闻数据与AI Agent示例，他展示了一条更可落地的知识图谱+生成式AI路径。

为什么GraphRAG会“长歪”：复杂性才是真正的敌人

这场分享一开始，Will就点出了GraphRAG实践中最容易被忽视的问题：不是模型不够强，而是系统复杂度失控。他用一句颇具记忆点的说法来形容今天的主题——“the knowledge graph mullet”，也就是“前面商务、后面摇滚”的发型。这个比喻背后的含义是：在用户和模型面前保持简洁，而在底层数据结构中允许复杂性存在。

他直言不讳地说，这个话题的目的就是“trimming GraphRAG complexity”。在大量GraphRAG项目中，团队往往在向量、chunk、embedding、schema之间疲于奔命，却忽略了一个更基础的问题：我们是否真的有一个稳定、可遍历、可解释的知识表示？

正是在这个背景下，他提出，不必在RDF和属性图之间“二选一”。相反，真正可持续的方案，往往来自对两种图范式的融合，而不是站队。

RDF vs 属性图：不是路线之争，而是视角互补

为了说明这种融合的必要性，Will先快速回顾了图数据库生态中最常见的分歧。在RDF世界里，我们习惯用三元组（subject-predicate-object）来描述事实，配合本体（ontology）和SPARQL查询语言，强调语义一致性和链接数据。这套体系来自语义网，擅长“定义世界是什么”。

而在属性图世界中，节点和边都可以携带丰富属性，更强调遍历效率和工程实用性，适合“在世界中快速行动”。Will强调，这两种思想并不冲突，“these concepts can be used together”，关键在于是否存在一个“canonical representation of the thing”——也就是一个权威、统一的事实表示。

这个判断非常重要，因为在GraphRAG中，如果底层图结构本身是割裂的，那么无论embedding多精细，最终检索到的上下文都会是碎片化的。

Dgraph的角色：以三元组为核心的混合图实践

在方法论之后，Will引入了具体实现——Dgraph。他提到，Dgraph最早在2017年开源，其最小的数据单元就是三元组。这一点让它天然继承了RDF的语义优势，但同时又支持属性图式的高效遍历。

他现场展示了Dgraph如何同时处理属性图和三元组：一方面，所有事实都可以回溯到三元组；另一方面，查询时却能像操作属性图一样，从节点出发进行多跳遍历。他特别强调，这种设计“allows us to traverse the graph very efficiently”，对GraphRAG至关重要。

在查询层面，Dgraph使用DQL。Will指出一个对工程师非常友好的细节：DQL返回的是JSON，而且“matches the structure of our selection set”。这意味着查询结果可以几乎无缝地进入下游的RAG或Agent流程，而不需要大量胶水代码。

从新闻数据到Embedding：GraphRAG的真实工作流

为了避免停留在抽象层面，Will用新闻数据做了一个具体示例。他从一篇文章节点出发，先遍历到主题节点，再从主题扩展到其他相关文章。这种“从事实到语义，再回到事实”的路径，正是GraphRAG中最有价值的检索方式。

在这个过程中，他再次点名了chunking和embedding的作用，但强调它们只是辅助手段。真正决定上下文质量的，是“the domain graph that we're traversing through to find relevant context for the model”。换句话说，embedding只是放大器，而知识图谱决定了信号本身是否清晰。

他还展示了DQL查询返回的JSON结构，让观众直观看到图遍历的结果是如何被模型消费的。这种从数据到模型的透明路径，是很多RAG系统中缺失的部分。

MCP Server与AI Agent：给模型一个安全可控的图世界

在演讲后半段，Will将话题推进到AI Agent。他演示了Dgraph MCP server，并解释这是一个为AI Agent准备的安全沙箱环境。通过MCP，Agent不仅能看到结果，还能看到“the DQL query used for each of these”，这为调试和可解释性提供了关键支持。

接着，他展示了如何从一个prompt出发，构建领域特定的Agent，并结合图中的数据生成更新后的代码片段和社交媒体内容。这一段并不追求炫技，而是强调一个现实问题：如果Agent无法理解你的领域结构，再复杂的提示工程也是徒劳。

在最后，他简单提到了hyper mode agents，作为未来探索方向，并以一句轻松的“thanks a lot for watching. Cheers.”结束了整场分享。

总结

这场演讲的价值，不在于某个新名词，而在于一种克制的工程观：GraphRAG不需要更复杂，而需要更合适的复杂度。通过融合RDF的语义严谨性和属性图的遍历效率，Will展示了一条“前台简单、后台强大”的路径。对正在构建RAG或AI Agent系统的团队来说，真正该优化的，往往不是模型参数，而是你如何表达和连接知识本身。

关键词： Knowledge Graph， GraphRAG， Dgraph， AI Agent， Embedding

事实核查备注：视频标题：The Knowledge Graph Mullet： Trimming GraphRAG Complexity；演讲者：William Lyon（视频中自称Will）；发布频道：AI Engineer；发布时间：2025-06-03；核心技术：RDF、三元组、属性图、Dgraph、DQL、JSON返回结构、GraphRAG、Embedding、AI Agent、Dgraph MCP server；示例数据：新闻文章与主题节点遍历；Dgraph开源时间：2017年

返回文章列表