Gemini这一年:一次“转折点”背后的模型、组织与未来
这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟,讲清了Gemini过去一年真正的转折点:为什么2.5 Pro意义重大,DeepMind为何从“纯研究”转向“研究+交付”,以及他们眼中多模态、Agent和“无限上下文”的下一站。
这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟,讲清了Gemini过去一年真正的转折点:为什么2.5 Pro意义重大,DeepMind为何从“纯研究”转向“研究+交付”,以及他们眼中多模态、Agent和“无限上下文”的下一站。
这期《The AI Daily Brief》梳理了GPT‑5从“千呼万唤不出来”到即将登场的完整脉络。与其说它是一次性能飞跃,不如说是OpenAI对过去一年路线选择的总交付:统一推理、多模态与工具,重新定义普通用户和开发者如何使用AI。
当所有人都在对着Claude Code和Gemini CLI评头论足时,亚马逊已经把一个“真正能干活”的AI Agent塞进了命令行,而且还免费。它不只会写代码,还会自己跑命令、修Bug、维护上下文,像一个不抱怨的资深工程师。更反直觉的是:它背后用的还是Claude 3.5 Sonnet。
这是一场来自OpenAI开发者体验团队的一线分享。Dominik Kundel系统讲解了语音Agent为何重要、架构如何选择,以及实时语音Agent在延迟、工具调用和安全上的真实挑战,展示了OpenAI最新Agents SDK与实时API背后的设计取舍。
这是一场关于“上下文”的技术演讲。Windsurf的工程师Sam Fertig用轻松的开场和层层递进的推理,解释了为什么当下AI写代码真正的瓶颈不在模型能力,而在于是否真正理解“你”和“你的代码库”。
微软研究院Graph团队负责人Jonathan Larson,通过一系列真实演示展示了GraphRAG如何用“结构化记忆”解决大模型在复杂代码库和长上下文中的根本瓶颈。这场分享不仅关乎检索增强生成,更揭示了AI Agent走向可执行软件工程的关键路径。
MongoDB收购的创业公司CEO、斯坦福教师腾宇·马,从一线实践出发,讲述RAG在2025年的真实状态:为什么它仍然不可替代、哪些改进已经被验证有效,以及多模态Embedding将把RAG带向哪里。
很多人以为,设计转代码的关键是模型够不够强。但 Figma 在这次 Q&A 里反复强调的却是另一件事:上下文怎么给,比模型本身更重要。从“不要一次性丢整屏设计”到 MCP 只读策略背后的安全考量,这是一场关于 AI Agent 如何真正融入生产环境的深度对话。
当企业纷纷押注“智能体时代”,真正的分歧才刚刚开始:是构建高度协作的多智能体系统,还是打磨一个上下文完整、足够可靠的单智能体?Anthropic与Cognition给出了几乎相反的答案,而这场分歧,决定了AI系统能走多远。
Anthropic 产品经理 Theodora Chu 亲述 MCP 的起源与野心:它并不是又一个工具调用协议,而是一场围绕“模型自主性”的长期赌注。从工程师反复复制上下文的痛点,到 Cursor、Google、OpenAI 的集体采用,这次演讲给了创业者非常具体的判断框架:接下来该往哪里建。