把失败变成特性:Zapier两年AI Agent评估血泪史
Zapier团队分享了两年构建AI Agent平台的真实教训:难点不在模型,而在评估与反馈系统。本文还原他们如何把失败当作产品燃料,建立数据飞轮,并用工程化方法驯服不确定性的AI系统。
Zapier团队分享了两年构建AI Agent平台的真实教训:难点不在模型,而在评估与反馈系统。本文还原他们如何把失败当作产品燃料,建立数据飞轮,并用工程化方法驯服不确定性的AI系统。
Sourcegraph CTO Beyang Liu 认为,AI 编码代理不是更聪明的 Copilot,而是一种全新的软件交互范式。他从模型演进、产品设计到真实用户行为,拆解了“如何真正用好编码代理”这项正在浮现的新技能。
这场来自 AI Engineer 的分享,直面一个正在失控的问题:当 AI Agent 不再只是聊天,而是代表用户调用 API、操作系统、执行交易,安全体系还能沿用老一套吗?Bobby 和 Cam 用真实架构、失败隐患和现场 Demo,给出了基于开放标准的答案。
这是一场面向工程师的GraphRAG入门式工作坊。演讲者没有堆砌概念,而是通过可视化、Notebook和查询演示,带观众理解GraphRAG是什么、为什么要用,以及在真实系统中如何一步步落地。
这是一场来自OpenAI开发者体验团队的一线分享。Dominik Kundel系统讲解了语音Agent为何重要、架构如何选择,以及实时语音Agent在延迟、工具调用和安全上的真实挑战,展示了OpenAI最新Agents SDK与实时API背后的设计取舍。
在这场演讲中,Docker 创始人、Dagger CEO Solomon Hykes 用十年平台工程经验,直面一个新问题:当大量 AI coding agent 开始“结对编程”,混乱如何避免?他的答案不是更聪明的提示词,而是更严格、可组合的运行环境。
Zed 联合创始人 Nathan Sobo 通过一次真实的产品实践,讲述了当 AI 引入软件系统后,传统确定性测试如何失效,以及他们如何一步步构建“随机但可控”的评估体系,让 AI 功能也能被严肃地交付。
这场演讲并不是在教你如何快速搭一个MCP Server,而是在追问一个更难的问题:当AI Agent真的进入企业环境,现有的MCP生态还缺什么?来自WorkOS与斯坦福的双重视角,让“Enterprise Ready”第一次被拆解成可落地的工程与安全问题。
这场分享中,Windsurf工程师Eashan Sinha并没有只谈“更聪明的AI”,而是提出了一个更难的问题:AI如何真正融入工程师的工作流。通过回顾Copilot、Agent到AI Flow的演进,他解释了为什么“协作感”和“上下文理解”才是下一代开发工具的核心。
这是一场关于“上下文”的技术演讲。Windsurf的工程师Sam Fertig用轻松的开场和层层递进的推理,解释了为什么当下AI写代码真正的瓶颈不在模型能力,而在于是否真正理解“你”和“你的代码库”。