正在加载视频...
视频章节
MongoDB收购的创业公司CEO、斯坦福教师腾宇·马,从一线实践出发,讲述RAG在2025年的真实状态:为什么它仍然不可替代、哪些改进已经被验证有效,以及多模态Embedding将把RAG带向哪里。
2025年的RAG走到哪一步了?一位创业者的判断
MongoDB收购的创业公司CEO、斯坦福教师腾宇·马,从一线实践出发,讲述RAG在2025年的真实状态:为什么它仍然不可替代、哪些改进已经被验证有效,以及多模态Embedding将把RAG带向哪里。
从创业到被收购:为什么他仍然押注RAG
理解一项技术是否有未来,往往要看真正把它当作“产品核心”的人如何下注。演讲一开始,腾宇·马简单介绍了自己的背景:他是Voyage AI(演讲中也称Forage AI)的CEO和联合创始人,公司刚刚被MongoDB收购,同时他还在斯坦福大学任教。这不是一个纯研究者的视角,而是一个在真实客户、真实数据和真实系统中反复验证过的立场。
在生成式AI爆发之后,很多人问过同一个问题:当大模型的上下文窗口越来越长,RAG(Retrieval-Augmented Generation,检索增强生成)是否还必要?腾宇的回答非常直接——“that's why I believe in RAG”。在他看来,RAG并不是权宜之计,而是一种更符合信息组织本质的系统架构。
他将问题重新定义为:你是希望模型‘记住一切’,还是希望系统‘随时找到对的东西’?正是这个区分,构成了他后续所有技术判断的出发点。
长上下文不是解药:信息组织方式才是关键
这一节为什么重要?因为它击中了很多团队正在犯的结构性错误。腾宇在演讲中用一张总结性幻灯片,对比了几种主流路径:纯大模型、长上下文输入、微调,以及RAG。
他的核心观点是:上下文窗口再长,本质仍然是“一次性喂给模型”。这在规模、成本和可控性上都会遇到瓶颈。相反,RAG提供的是一种“分层存储和按需访问”的模式。他形容这是一种“hierarchical way to store your information”,先通过检索定位相关信息,再让大模型负责理解和生成。
这背后隐含的判断是:企业知识并不是一段连续文本,而是高度结构化、不断变化的集合。把所有内容塞进上下文,既浪费,也危险。一旦检索层足够强,生成层反而可以保持相对稳定。
检索质量的真实提升:不是1%,而是数量级
如果RAG要继续成立,检索本身必须显著变好。腾宇在演讲中给出了一些来自Voyage实践的结果。他提到,在特定评估中,相关文档命中数量可以从原来的个位数,提升到20甚至30个,整体效果“on average is 80%”。
这些数字背后的重点不在于绝对值,而在于方向:Embedding模型和检索策略的进步,已经不是边际改良,而是会直接改变系统可用性的级别。他特别强调,这种提升并不是通过“更复杂的生成”,而是通过更专注的检索建模。
同时,他也坦率地谈到了权衡。针对领域定制的Embedding模型,确实能带来更高精度,但会牺牲一定的通用性和部署灵活性。这不是论文里的最优解问题,而是工程中的取舍问题。
多模态Embedding:RAG的下一站
为什么多模态如此关键?因为真实世界的知识,早已不只存在于文本中。腾宇在演讲后半段明确指出,RAG的一个重要发展方向,是多模态Embedding。
他提到团队已经在评估多种文档形式,包括截图、表格、图像以及纯文本。这意味着“检索”不再只是找一段文字,而是定位一个信息单元——可能是一张表、一个图,或一页扫描文档。
这一步的意义在于,它让RAG从‘文档搜索+生成’,升级为‘知识定位+推理生成’。在他描绘的愿景中,Embedding将成为连接不同模态、不同存储形态的统一接口,而RAG则是调度这一切的系统框架。
总结
这场演讲最有价值的地方,并不在于某个具体模型或参数,而在于一种工程化的判断:RAG不是被大模型淘汰的过渡方案,而是与模型能力共同进化的长期架构。从分层信息组织,到检索质量的数量级提升,再到多模态Embedding,腾宇·马给出的路线图提醒我们——真正决定系统上限的,往往不是生成有多强,而是你能不能在正确的时间,找到正确的信息。
关键词: RAG, 检索增强生成, Embedding, 多模态, 上下文窗口
事实核查备注: 腾宇·马:演讲者,自称Voyage AI/Forage AI CEO与联合创始人;公司被MongoDB收购;任教于斯坦福大学。技术术语:RAG(Retrieval-Augmented Generation)、Embedding、多模态Embedding、上下文窗口。数据表述:提到检索结果数量提升至20-30个,平均效果约80%;未给出具体评测集名称。引用原话包括“that's why I believe in RAG”“hierarchical way to store your information”。