AI 训练真正的瓶颈不是算力,而是网络:OpenAI 刚刚掀桌了
当所有人都在疯狂堆 GPU、比拼算力规模时,OpenAI 在最新一期播客里抛出一个反直觉结论:真正卡住 AI Scaling 的,不是芯片不够快,而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式,并准备把它变成行业标准。
当所有人都在疯狂堆 GPU、比拼算力规模时,OpenAI 在最新一期播客里抛出一个反直觉结论:真正卡住 AI Scaling 的,不是芯片不够快,而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式,并准备把它变成行业标准。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
这期 TBPN 把几条原本不该放在一起的线索硬生生拧成了一股趋势:Karpathy 在红杉谈 Software 3.0,vibe coding 开始吞噬传统开发;GameStop 试图吞下 eBay;而另一边,XAI 的 GPU 只跑到 11%。如果你在做 AI,这些碎片拼起来,会改变你对“下一代计算”和“创业窗口”的判断。
当所有人都在盯着参数规模时,这场对话却反其道而行:LLM 的成败,早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账,一次性摊在桌面上。
如果你以为AI的下一步只是更大的模型,那这期TBPN会直接打脸:SpaceX把算力押给Cursor,Imagen 2.0突然“有审美”了,而GPU、代码生成、图像模型正在被重新排位。这不是零散新闻,而是一次产业重组的实时画面。
OpenAI 给 Codex 加了一个会持续截图的“记忆体”,内部称它像“心灵感应”。与此同时,Anthropic 一边被五角大楼起诉,一边却被 NSA 悄悄使用。安全事故、算力军备竞赛、以及即将发布的新模型,都在指向同一个信号:AI 正在全面进入真实世界的工作流。
同样是AI浪潮,有人用数据反击“末日论”,有人用危机感重塑组织。Salesforce和Verizon两位CEO的截然不同判断,正在影响SaaS、就业、Agent产品和企业预算的走向。这期节目信息密度极高,几乎每一段都在改写从业者的默认认知。
很多人以为AI安全只能靠更大的模型、更贵的系统。但这支视频抛出一个反直觉的结论:用一个成本低到“1美元级别”的微调ModernBERT,就能构建有效的LLM安全护栏,而且不是纸上谈兵,而是真正跑过攻击向量的实战方案。
一家卖羊毛鞋的公司,股价暴涨后宣布转型做AI算力;另一边,Snap用AI当理由裁掉16%员工;亚马逊却豪掷百亿美元押注卫星直连手机。这期TBPN把当下AI周期的三种极端状态,一次性摊在了台面上。
如果你还觉得大模型只能在云端跑,这场NVIDIA的实测会直接打脸:14B模型本地20 token/s,首token快3.4倍。更重要的不是跑得多大,而是开发者终于能在自己桌边,摸清真实的工程边界。