别再把AI全丢给云端了:DeepMind正在把Agent塞进你的设备
当所有人都在讨论更大的模型、更贵的Token时,Google DeepMind在这场分享里反复强调了一件“反直觉”的事:真正能跑起来的AI,必须回到设备本身。从Gemma 4到端侧Agent,这不是性能妥协,而是一场架构转向。
当所有人都在讨论更大的模型、更贵的Token时,Google DeepMind在这场分享里反复强调了一件“反直觉”的事:真正能跑起来的AI,必须回到设备本身。从Gemma 4到端侧Agent,这不是性能妥协,而是一场架构转向。
当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
当所有人都在盯着参数规模时,这场对话却反其道而行:LLM 的成败,早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账,一次性摊在桌面上。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
当所有排行榜都在狂飙,Peter Gostev却当众泼了一盆冷水:模型变强了,但在“拒绝胡扯”这件事上,进步几乎停滞。更残酷的是,新模型有时还不如小模型。这场演讲用一个看似荒谬的基准,戳穿了我们对AI能力的集体幻觉。
如果你还沉迷于“跑最新、最大的模型”,那 AIE Miami 第二天的内容可能会让你坐立不安。从 agentic coding 的心态转变,到推理延迟的真实代价,再到 Cursor、AutoGPT 背后的产品哲学,这一天的共识只有一个:AI 工程正在彻底换玩法。
如果你还以为 AI 在生命科学里只是“帮忙分析数据”,那这期播客会直接颠覆你的认知。OpenAI 的研究者们公开讨论了一件更激进的事:科研正在从“人类不够快”,转向“算力不够多”。而这,才是真正的分水岭。
YC 最新一期《Light Cone》抛出一个让人坐不住的判断:机器人不是慢慢变好,而是刚刚跨过一个临界点。成本在塌陷、模型在统一、数据在重组,最重要的是——机器人第一次开始遵循我们在 AI 软件世界里熟悉的 scaling 逻辑。