他发现推理才是AI的真瓶颈,于是干了一件没人愿意干的事
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
当大多数人还在讨论“哪个API更强”时,这场工作坊直接把话说透:你完全可以在本地,从零开始,亲手训练一个大语言模型。没有云算力神话,没有巨头资源,只有最朴素、也最容易被忽略的四个核心模块。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
当所有人都在追逐大语言模型的“最终形态”时,NVIDIA 机器人负责人 Jim Fan 给出了一个反直觉答案:真正的 End Game 不在语言里,而在物理世界。一次演讲,把机器人、世界模型和 AGI 的关系彻底讲透。
在所有人都在追逐更大参数、更强算力时,Liquid AI 的 Maxime Labonne 反其道而行:专注 3.5 亿到 240 亿参数的小模型,并且明确说——小模型不是大模型的“缩水版”。这场分享,几乎逐条拆掉了从大模型时代继承下来的错误直觉。
OpenAI 给 Codex 加了一个会持续截图的“记忆体”,内部称它像“心灵感应”。与此同时,Anthropic 一边被五角大楼起诉,一边却被 NSA 悄悄使用。安全事故、算力军备竞赛、以及即将发布的新模型,都在指向同一个信号:AI 正在全面进入真实世界的工作流。
当 Tim Cook 宣布退场,市场以为这是一条“早就被定价”的新闻,但 TBPN 这期节目真正可怕的不是苹果换帅,而是一个信号:硬件、AI Agent、创始人文化,正在被同一股力量重新拧紧。
大多数人以为,生成式图像和视频模型的胜负手在网络结构或参数规模。但在这场关于“如何把生成模型真正做大”的演讲里,Sander Dieleman反复暗示了一个更残酷的事实:模型只是结果,真正决定上限的是数据、表示和训练体系的系统性设计。
很多人以为AI安全只能靠更大的模型、更贵的系统。但这支视频抛出一个反直觉的结论:用一个成本低到“1美元级别”的微调ModernBERT,就能构建有效的LLM安全护栏,而且不是纸上谈兵,而是真正跑过攻击向量的实战方案。
一家卖羊毛鞋的公司,股价暴涨后宣布转型做AI算力;另一边,Snap用AI当理由裁掉16%员工;亚马逊却豪掷百亿美元押注卫星直连手机。这期TBPN把当下AI周期的三种极端状态,一次性摊在了台面上。