把AI做成“主权系统”后,工程师最先崩掉的不是模型
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。
这不是一场炫技发布会,而是一次“把模型当工具”的现场演示。来自 Google DeepMind 的 Guillaume Vernade 用一连串看似随意的 Demo,展示了一个反直觉的事实:生成式 AI 的真正门槛,早就不在模型能力,而在你会不会用。
几乎所有 AI 从业者都在用同一种方式做聊天,但真正拖垮体验的,恰恰是这套“行业默认”。这场演讲抛出一个刺耳结论:AI UX 崩坏,责任不在模型,而在你用错了连接方式。
AlphaGo 曾被认为是只有顶级实验室才能复制的奇迹,但 Eric Jang 在播客里抛出一个近乎挑衅的说法:今天,一个人、几千美元算力,就能从零“重建”它。更重要的不是算力,而是那套反直觉的思想结构。
如果你还在等“更大参数的LLM=更聪明的AI”,这期对话可能会让你停下来重想一遍。Yann LeCun在访谈中毫不客气地指出:大语言模型正在撞墙,真正的突破来自“世界模型”。更激进的是,他判断这个转折点会在2027年前变得无法忽视。
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
Laurie Voss 在这场演讲里抛出一个让很多工程师不舒服的事实:真正决定 AI Agent 能不能上线的,从来不是模型有多强,而是你有没有一套“能发现失败”的评估体系。这不是学术 talk,而是一条从 demo 到 production 的血路。
把大语言模型塞进国际象棋里,当教练而不是棋手,听起来很合理。但这场分享最狠的地方在于:LLM 最大的问题不是不懂棋,而是“太会解释”,却经常解释错。Play Magnus 团队用一整套 pipeline、agents 和 evals,才勉强把它拉回现实。
当 Hugo Santos 在台上说出“CI/CD is dead”时,台下先是笑声,然后是沉默。因为所有人都隐约感觉到:这可能不是危言耸听,而是正在发生的现实。这场来自 AI Engineer 的演讲,给出了一个刺眼但极具说服力的判断——不是 CI 不重要了,而是 Agent 规模的软件,已经把我们熟悉的 CI/CD 架构彻底撞穿。
OpenAI 刚刚把 Codex 从“会写代码的助手”,升级成“会用你电脑的同事”。它不抢鼠标、不录屏,却能同时操作多个应用,甚至比人类更快。这不是炫技,而是工作方式的分水岭。