Token 正在骗你:硅谷投资人重新计算 AI 的真实成本
所有人都在盯着 token 消耗,但真正决定 AI 生死的指标,可能恰恰不是 token。本期播客里,一位长期投资 OpenAI、Anthropic 的投资人,抛出了几个让硅谷都不安的判断:token 是幻觉,agent 才是引擎,而真正的稀缺品正在从算力转向人的连接。
所有人都在盯着 token 消耗,但真正决定 AI 生死的指标,可能恰恰不是 token。本期播客里,一位长期投资 OpenAI、Anthropic 的投资人,抛出了几个让硅谷都不安的判断:token 是幻觉,agent 才是引擎,而真正的稀缺品正在从算力转向人的连接。
如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。
这期 TBPN 一上来就抛出猛料:Cerebras 的 IPO 不是“还不错”,而是“好得离谱”。更反直觉的是,市场追捧的理由并不在训练,而在推理。Semi-Analysis 的深度拆解、OpenAI 的态度变化,以及 VC 圈的公开内斗,把 AI 基础设施的真实博弈摊在了台面上。
当所有人都在为电价、土地和散热发愁时,Starcloud 的 CEO 直接给出一个反直觉答案:未来最便宜的算力在太空。更夸张的是,他们已经把 NVIDIA H100 送上轨道,还真的跑起了模型。
当所有人都在疯狂堆 GPU、比拼算力规模时,OpenAI 在最新一期播客里抛出一个反直觉结论:真正卡住 AI Scaling 的,不是芯片不够快,而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式,并准备把它变成行业标准。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
当所有人都在盯着参数规模时,这场对话却反其道而行:LLM 的成败,早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账,一次性摊在桌面上。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。