比Scaling Laws更狠的方向:异构智能正在把GPT变便宜10倍
当所有人还在讨论“更大的模型、更贵的GPU”时,一位工程师直接给出结论:这是条正在失效的路。在这场演讲中,Adrian Bertagnoli 用真实系统和硬数据证明——不靠更强模型,靠“异构智能”,AI可以同时变得更聪明、更快、还便宜一个数量级。
当所有人还在讨论“更大的模型、更贵的GPU”时,一位工程师直接给出结论:这是条正在失效的路。在这场演讲中,Adrian Bertagnoli 用真实系统和硬数据证明——不靠更强模型,靠“异构智能”,AI可以同时变得更聪明、更快、还便宜一个数量级。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
当代码生成从每秒50个Token飙到1200个,真正的瓶颈不再是模型,而是人。Cerebras的Sarah Chieng在这场演讲中抛出一个反直觉观点:模型越快,开发者越要“慢”。否则,我们只是在用20倍的速度制造技术债。
大模型时代,我们习惯把“算力”当成一个抽象数字。但在这期对话里,Reiner Pope 从最原始的乘法器讲起,拆开每一个逻辑门,解释为什么矩阵乘法会“吃掉”芯片的一切,以及这正是 Tensor Cores 和新一代 AI 硬件诞生的真正原因。
当所有人都在担心“AI会不会让人失业”时,一家深度使用AI Agent的公司却在疯狂招人。这不是鸡汤,而是一个反直觉的行业真相:自动化并没有消灭工作,反而制造了更多、更高级的人类工作。
今年的 Google I/O 没有“全场欢呼”。相反,它留下了一堆分裂的情绪:智能眼镜很酷,Gemini 很强,但开发者并不买账。更微妙的是,当 SpaceX IPO、黄仁勋的季度表现和苹果的“轻量化未来”被同时提起,你会发现:AI 的主战场,正在悄悄换规则。
一场Google I/O反应直播,从机器人当众摔倒开始,却一路聊到智能眼镜、Gemini模型争议、SpaceX级别的超级IPO,以及AI图像失控的现实风险。这不是一场发布会复盘,而是一次对“AI正在走向哪里”的真实拆解。
当所有人都在谈模型能力、参数规模时,Anthropic却花了3亿美元,买下一家几乎不被大众熟知的开发者工具公司Stainless。原因只有一个:大语言模型真正卡脖子的地方,不在模型本身,而在它如何“安全、快速、可靠地”接入真实世界。
今年的 Google I/O,看起来像一场产品发布会,实际上却更像一次商业宣言:更强的视频模型、更快的 Gemini 3.5 Flash、更像“活物”的个人 AI Agent,但真正的猛料只有一个——Google 终于要把 AI 变成一台可持续印钞的机器。
如果一个提示,就能调动“50名科学家”为你工作一天,会发生什么?DeepMind最新展示的 Co-Scientist,不是帮你写论文,而是直接生成可验证的新科学假设,把原本需要数月甚至数年的探索,压缩到几天之内。