2025年的RAG走到哪一步了?一位创业者的判断
MongoDB收购的创业公司CEO、斯坦福教师腾宇·马,从一线实践出发,讲述RAG在2025年的真实状态:为什么它仍然不可替代、哪些改进已经被验证有效,以及多模态Embedding将把RAG带向哪里。
MongoDB收购的创业公司CEO、斯坦福教师腾宇·马,从一线实践出发,讲述RAG在2025年的真实状态:为什么它仍然不可替代、哪些改进已经被验证有效,以及多模态Embedding将把RAG带向哪里。
在AI Agent快速走向生产环境的当下,微软在AI Engineer大会上展示了一个关键能力:让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示,解释它如何通过自动化攻击策略、评估与防护闭环,帮助工程师构建真正可被信任的AI应用。
LlamaIndex 开发者关系副总裁 Laurie Voss 用 15 分钟浓缩了一个关键信息:真正能在生产中跑起来的 Agent,靠的不是“更聪明的模型”,而是扎实的设计模式。这场演讲从 RAG 的必要性讲起,逐步引出链式、路由和编排式等 Agent 架构,给出了一套可复用的方法论。
在这场演讲中,Jim Bennett用一连串真实翻车案例和现场演示,解释了为什么AI代理天生不值得“信任”,以及如何通过“以评估为核心、以可观测性为驱动”的方法,把不可预测的AI系统驯服成可控的软件系统。
这场由 Pipecat 与 Tavus 联合分享的演讲,罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行,以及真正的难点不在模型本身,而在编排与部署。读完你会理解,一个 600 毫秒响应的对话式视频系统,究竟是怎样被搭出来的。
这场来自 AI Engineer 的演讲,通过 Gemini Live API 与 Pipecat 的现场演示,系统拆解了“实时语音 AI 为什么难、难在哪里、又是如何被逐层解决的”。它不仅讲技术,更解释了为什么语音会成为下一代 AI 应用的默认入口。
这期《AI Daily Brief》提出了一个正在快速升温的新概念:上下文工程。它不再纠结一句提示词怎么写,而是关注如何为大模型和智能体持续、系统地提供正确的信息环境。文章将解释它为何出现、与提示工程的本质差异,以及它为什么可能成为下一阶段AI应用的核心能力。
Kyle Vogt 说了一句很“狂”的话:未来五年,没有家用机器人的房子会显得很奇怪。更狠的是,他判断下一个千亿美金公司,可能诞生在一个不到100人的小团队里。这不是畅想,而是他在卖掉 Cruise、踩过无数坑之后,对 AI、机器人和创业规模的最新下注。
在 Figma Config 2025 的舞台上,Jude Sue 抛出一个让全场安静下来的判断:无论是社交、加密货币,还是大语言模型,真正决定产品生死的,从来不是技术本身,而是“信任”。这场演讲,把美元、Airbnb、GPT-3.5 和自动驾驶放进同一条逻辑链,揭示了 AI 时代最被低估的设计变量。
很多人以为自己在用 AI,其实只是和模型聊天。这期视频里,Greg Isenberg 请来 Riley Brown,手把手演示:如何用 MCP 给 Claude 接上真实工具,让 AI 变成能执行工作流的 Agent——效率提升不是一点点,而是认知层级的差异。