把大模型思路照搬到小模型,是边缘AI最大的误区
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
Google DeepMind 悄悄干了一件“反直觉”的事:没有堆参数、没有锁生态,却用 Gemma 4 把开源模型直接送进榜单前六。从 31B 多模态到能跑在设备端的小模型,这次更新释放了一个强烈信号——下一轮 AI 竞争,不再只属于巨无霸模型。
今天的猛料不在模型参数,而在交易结构。SpaceX 与 Cursor 的合作,把“算力、品牌、并购期权”打包在一起,重新定义了 AI 公司怎么长大;与此同时,ChatGPT Images v2 用审美而非基准测试,悄悄改写了多模态竞争规则。
如果你还沉迷于“跑最新、最大的模型”,那 AIE Miami 第二天的内容可能会让你坐立不安。从 agentic coding 的心态转变,到推理延迟的真实代价,再到 Cursor、AutoGPT 背后的产品哲学,这一天的共识只有一个:AI 工程正在彻底换玩法。
这场对谈抛出一个反直觉观点:在生成式 AI 时代,真正的“创作者”可能不是你。模型更像一场永远即兴的演出,而人类,正在从创作者变成高级观众与合作者。这不是贬低,而是一次创作范式的重置。
YC 最新一期《Light Cone》抛出一个让人坐不住的判断:机器人不是慢慢变好,而是刚刚跨过一个临界点。成本在塌陷、模型在统一、数据在重组,最重要的是——机器人第一次开始遵循我们在 AI 软件世界里熟悉的 scaling 逻辑。
当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。
如果你还以为 meme 只是配图加白字,那你已经落后一个时代了。这期 TBPN 把三件看似无关的事连成了一条线:AI 正在重写 meme 的传播逻辑、开源依赖成了新的攻击面,而量子计算正在悄悄逼近加密体系的底线。
这周的英伟达GTC大会,真正的爆点不是更猛的训练GPU,而是一次方向性的转弯:英伟达首次正面切入AI推理、代理和算力基础设施全栈。与此同时,AI Agent被写进27家上市公司的“风险清单”,字节的视频模型被好莱坞按下暂停键。AI行业,正在集体换挡。
很多人以为,AI进医疗靠的是更大的模型、更长的上下文。但在这期 OpenAI 官方播客里,他们反复强调的却是另一件事:如果没有成百上千名真实医生深度参与,模型连上线资格都没有。这是一套和主流 AI 叙事完全不同的医疗 AI 路线。