把法律文件变成“可推理的图”:诉讼AI为何离不开知识图谱

AI PM 编辑部 · 2025年07月22日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

这场演讲中,WhyHow 的 Tom Smoker 讲述了他们如何在诉讼与法律发现中使用知识图谱与多智能体系统。核心不在于更大的模型,而在于把零散、混乱的法律文本转化为可被 AI 推理、裁剪和决策的结构化图,从而真正影响律师的判断。

把法律文件变成“可推理的图”:诉讼AI为何离不开知识图谱

这场演讲中,WhyHow 的 Tom Smoker 讲述了他们如何在诉讼与法律发现中使用知识图谱与多智能体系统。核心不在于更大的模型,而在于把零散、混乱的法律文本转化为可被 AI 推理、裁剪和决策的结构化图,从而真正影响律师的判断。

为什么在法律行业谈 Graph RAG,而不是更大的模型

这一演讲一开始就点出了一个法律科技里常被忽视的问题:法律文件不是“缺少智能”,而是“缺少结构”。Tom Smoker 解释,他们之所以不断被问“为什么要用图(graph)”,正是因为在法律行业,单纯把文档丢进大模型并不能解决核心痛点。合同、起诉书、证词、证据之间存在大量隐含关系,如果这些关系不能被显式表达,AI 只能做表层生成。

他给出的判断很直接:“Broadly to me, graphs are relations.” 在他看来,图的价值不在于可视化,而在于把事实、主体、时间、行为之间的关系固定下来。这些关系一旦被建模,就可以在检索增强生成(RAG)中反复使用,而不是每次都让模型从头‘猜’。

这也是他们将 Graph RAG 引入法律场景的原因:图并不是为了炫技,而是为了让系统在面对成千上万份文件时,仍然能回答‘这些文件之间到底发生了什么’。这种结构化数据,对领域专家尤其重要,因为它保留了法律推理所依赖的上下文与因果链。

多智能体不是噱头,而是白领工作流的拆解工具

在演讲的中段,Tom 把话题从“图是什么”推进到“图如何驱动多智能体系统”。他明确区分了单一大模型和多智能体的角色:“multi-agent systems,这正是我想定义的第二个关键点。”

在 WhyHow 的实践中,多智能体并不是同时胡乱对话,而是被严格地编排在一个由图约束的流程中。复杂的白领工作流——尤其是白领犯罪或大型诉讼——被拆解成多个子任务:理解事实、定位证据、比对案例、形成判断。每一个子任务由一个 agent 负责,而 agent 之间的输入输出关系,本身就由知识图谱来约束。

他形容这是“break down a complicated white collar workflow by a graph”。图既是任务分解的蓝图,也是防止 agent 走偏的护栏。没有图,多智能体只会放大不确定性;有了图,系统才能在复杂决策中保持一致性和可解释性。

从法律发现到案件判断:图如何改变诉讼节奏

真正打动人的部分,来自他们在诉讼(litigation)和法律发现(discovery)中的具体应用。Tom 用大量时间解释:诉讼本质上是一个不断缩小不确定性的过程,而传统方式极度依赖人工筛选和经验判断。

在现实中,海量文件需要人工审查,律师往往只能在很晚的阶段,才‘感觉到’某一类投诉或事实正在聚集。而通过图,他们可以更早地看到模式:哪些主体反复出现、哪些行为在不同案件中形成密度、哪些证据之间存在交叉引用。

他提到一个关键转折点:如果“you can take all of that information”并把它们连接成图,系统就能支持“data driven decision”。这意味着,律师不是在最后阶段被动反应,而是能在更早的时候,基于图中的结构性信号采取行动。这种提前量,本身就是诉讼中的竞争优势。

这不是一个纯 GenAI 问题,而是一个持续构建图的过程

在结尾,Tom 特别强调了一点反直觉的经验教训:“this is not just a genai problem”。生成式 AI 只是其中一层,更困难、也更重要的是持续构建和修正知识图谱。

图不是一次性产物,而是需要不断“capturing, expanding, pruning”。新的文件进来,关系会变;旧的假设被推翻,边就要被删掉。多智能体系统的价值,也正是在这种迭代中逐渐显现,而不是一开始就完美。

他总结他们的方法是“iteratively build that graph”。这句话背后隐含的态度是:法律智能不是靠一次模型升级完成的,而是靠长期、谨慎地把现实世界映射成可推理结构。对法律行业来说,这种慢工,反而是最快的路。

总结

这场演讲提供的最大启发在于:在高风险、强逻辑的行业里,AI 的价值不取决于生成得多像人,而取决于是否理解并尊重结构。知识图谱让法律事实变得可计算,多智能体让复杂工作流可拆解,而真正的竞争力,来自持续维护这张“事实之网”的能力。


关键词: 知识图谱, Graph RAG, 多智能体系统, 法律科技, 诉讼AI

事实核查备注: 演讲者:Tom Smoker;公司:WhyHow;核心技术概念:Graph RAG、知识图谱(graphs are relations)、多智能体系统(multi-agent systems)、法律发现(legal discovery)、生成式AI;引用原话均来自公开视频中的定义性表述,无具体数字或产品名称。