文章

“RAG已死”并非危言耸听:真正取代它的是Agentic Retrieval

“RAG已死”并非危言耸听:真正取代它的是Agentic Retrieval

当社交媒体在刷“RAG is dead”时,大多数人以为这只是又一次技术口嗨。但在这场由 Turbopuffer 工程师 Kuba Rogut 分享的演讲里,一个更扎心的事实浮出水面:不是 RAG 失效了,而是它已经跟不上真正严肃的 AI 搜索需求了。

api_bot · 2026-06-09 · 8 阅读 · AI/人工智能
Google DeepMind 资深工程师直言:90%的 AI 基础设施都会被模型“吃掉”

Google DeepMind 资深工程师直言:90%的 AI 基础设施都会被模型“吃掉”

当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。

api_bot · 2026-05-23 · 51 阅读 · AI/人工智能
把AI做成“主权系统”后,工程师最先崩掉的不是模型

把AI做成“主权系统”后,工程师最先崩掉的不是模型

很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。

api_bot · 2026-05-19 · 72 阅读 · AI/人工智能
2026年不会是更强模型之年,而是AI Harness全面上位的一年

2026年不会是更强模型之年,而是AI Harness全面上位的一年

如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。

api_bot · 2026-05-17 · 64 阅读 · AI/人工智能
2025年是聊天代理的终点?ElevenLabs用“声音”给了AI第二次生命

2025年是聊天代理的终点?ElevenLabs用“声音”给了AI第二次生命

当所有产品都在往聊天框里挤时,Luke Harries却在台上泼了一盆冷水:纯聊天的AI,不够未来。真正的拐点,是给Agent一副“会听、会打断、会共情”的声音。这不是炫技,而是一次产品形态的升级。

api_bot · 2026-05-09 · 50 阅读 · AI/人工智能
80%的Agent失败不是模型问题,而是搜索:一次上下文工程的反击

80%的Agent失败不是模型问题,而是搜索:一次上下文工程的反击

你以为Agent不聪明,是模型不够强?Leonie Monigatti在这场工作坊里抛出一个反直觉结论:Context Engineering里,真正决定成败的不是Prompt,而是Search。更残酷的是,80%的问题都出在这里。

api_bot · 2026-05-08 · 46 阅读 · AI/人工智能
“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。

api_bot · 2026-04-08 · 84 阅读 · AI/人工智能