OpenAI 在 Build Hour 里透露的真相:Agent 真正难的不是模型,而是上线
如果你以为做 AI Agent 的难点在模型能力,这场 OpenAI Build Hour 会直接打脸你。整整一小时,OpenAI 团队反复强调:真正折磨工程团队的,是部署、生命周期和“跑着跑着不死”的现实问题,而 Agents SDK 正是为这些痛点而生。
如果你以为做 AI Agent 的难点在模型能力,这场 OpenAI Build Hour 会直接打脸你。整整一小时,OpenAI 团队反复强调:真正折磨工程团队的,是部署、生命周期和“跑着跑着不死”的现实问题,而 Agents SDK 正是为这些痛点而生。
当所有人都在把最强的大模型推向云端,Alex Cheema 却在做一件反方向的事:让 Frontier AI 跑在你自己的硬件上。这场看似“逆潮流”的尝试,背后藏着对成本、控制权和 AI 未来形态的深刻判断。
这次 Google I/O,DeepMind 高管透露了一个被很多人忽略的信号:模型不再是主角,真正的主线是“智能体如何长期在线、持续干活”。从 Gemini 3.5 Flash 到 Omni,再到托管 Agent,Google 正在重写开发者与 AI 的关系。
很多人以为“真·AI 应用”只能在云端完成,但 Google DeepMind 在这场 AMA 里给了一个完全相反的答案:Android 正在把生成式 AI 直接塞进手机里,而且已经能用。这场对话不讲概念,直面限制、取舍和真正可落地的路径。
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
当整个行业都在嘲笑“Token maxing 是智商税”时,AI Daily Brief 却反手给了一个更激进的结论:真正危险的不是烧 Token,而是不敢烧。尤其在 AI Agent 和新一代模型部署时代,这种保守,正在悄悄拉开高手与普通团队的差距。
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。