“RAG已死”并非危言耸听:真正取代它的是Agentic Retrieval
当社交媒体在刷“RAG is dead”时,大多数人以为这只是又一次技术口嗨。但在这场由 Turbopuffer 工程师 Kuba Rogut 分享的演讲里,一个更扎心的事实浮出水面:不是 RAG 失效了,而是它已经跟不上真正严肃的 AI 搜索需求了。
当社交媒体在刷“RAG is dead”时,大多数人以为这只是又一次技术口嗨。但在这场由 Turbopuffer 工程师 Kuba Rogut 分享的演讲里,一个更扎心的事实浮出水面:不是 RAG 失效了,而是它已经跟不上真正严肃的 AI 搜索需求了。
很多人以为“语义搜索”是写代码的终极形态,但这场基准测试给了所有人一记冷水:Claude Code 默认不用语义搜索,反而效果更稳。TurboPuffer 的 Kuba 用真实数据对比了语义检索与 agentic 搜索,结论远比你想象复杂。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
你以为Agent不聪明,是模型不够强?Leonie Monigatti在这场工作坊里抛出一个反直觉结论:Context Engineering里,真正决定成败的不是Prompt,而是Search。更残酷的是,80%的问题都出在这里。
当整个 AI 圈都在 All in 向量数据库时,Neo4j CEO Emil Eifrem 在这期 Latent Space 里泼了一盆冷水:向量很重要,但它们解决不了“理解”。真正让 AI 变聪明的,是知识图谱、上下文和可解释的结构。这是一场关于“AI 为什么还不够聪明”的深度对谈。
上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。
一场看似杂乱的科技直播,背后却藏着 2026 年最关键的几条产业暗线:Elon Musk 的“御用银行家”如何定义资本权力、Apollo 为什么躲过 SaaS 的集体绞杀、中国机器人为何突然全面提速。这不是新闻汇总,而是一份给 AI 从业者的趋势地图。
如果你的孩子,未来会和一个 AI 认真谈恋爱,你会觉得奇怪吗?这是 Roblox CEO Dave Baszucki 在播客一开始抛出的问题。更炸的是,他并不是在讨论科幻,而是在解释:为什么 Roblox 正在为 40 年后的“4D 世界”打地基。这期对话,几乎把 AI、世界模型、虚拟人和下一代互联网的底牌一次性亮了出来。
本文深度还原了Jack Morris在2025年Cornell演讲的核心洞见,聚焦大语言模型(LLM)如何突破知识边界,从上下文窗口、检索增强生成(RAG)到将知识直接训练进模型权重。通过真实案例、前沿技术对比和行业趋势,帮助你理解下一代AI系统的构建方法。
这场演讲不是在罗列RAG新名词,而是给出了一套“何时该用什么”的实战路线图。前Google搜索工程师David Karam用真实失败案例解释:RAG不是一次性架构设计,而是按影响和成本逐步叠加的工程决策过程。