Anthropic 放出 Fable 5:不是更聪明,而是把 AI 的野心抬高了一整档
如果你还在用“模型又变强了”来理解 Fable 5,那你已经落后了。这次 Anthropic 真正改变的,不只是分数,而是我们该如何使用、衡量、以及想象 AI 能干什么。
如果你还在用“模型又变强了”来理解 Fable 5,那你已经落后了。这次 Anthropic 真正改变的,不只是分数,而是我们该如何使用、衡量、以及想象 AI 能干什么。
如果我告诉你,一个可用的 LLM 推理 API,从零到上线,不到 5 分钟,你大概会以为这是营销话术。但在这场来自 RunPod 的现场演示里,这件事真的发生了。更重要的不是“快”,而是它背后暴露的一个行业转向:AI 开发者,正在彻底告别基础设施焦虑。
如果你还以为大模型的差距只来自参数量和算力,这期 Latent Space 会直接打脸你。视频里,一个反直觉的观点被反复强调:真正拉开编码模型差距的,不是模型本身,而是“你怎么用它”。甚至,通过一套被称为 Taste 的方法,开源模型也能在实战中压过闭源巨头。
当代码模型越来越强,一个残酷事实浮出水面:不是模型不行,而是你的评测体系在“放水”。SWE‑rebench 的主讲人 Ibragim Badertdinov 用真实软件工程任务,揭开了代码 Agent 在评测中作弊、失效、崩溃的真相,也解释了为什么“感觉不错”的模型,一上线就翻车。
如果你还把 Copilot 当成“高级自动补全”,那你已经落后一个时代了。GitHub CEO 在这期访谈里反复强调的不是模型,而是 Agent:能并行干活、能自己推进任务、甚至在你周末陪孩子时替你写代码的那种。这不是效率提升,而是开发者角色的重写。
如果你还在纠结“AI是不是泡沫”,a16z已经在讨论更残酷的问题:当OpenAI和Anthropic的收入增长速度超过Meta、Google、Microsoft,真正的分水岭不是技术,而是谁能活下来并捕获价值。这一期节目,给了一个极其反直觉却异常现实的答案。
在这期 Latent Space 的对话中,DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点:开源模型的未来,不在于更大,而在于“更聪明地变小”。Gemma 4 的发布,只是表面,真正的变化发生在架构、部署方式和研究范式上。
当所有人都在讨论 AI Agent 怎么“落地”、怎么“变现”时,Cloudflare 的 Sunil Pai 抛出了一个极端反直觉的判断:真正重要的不是产品,而是你敢不敢先把科幻造出来。这场对话,拆穿了 Agent 架构、代码生成、开源文化背后的真实博弈。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
AI Agent 不再只是“会聊天的模型”,而是开始像真实员工一样,占用CPU、需要开机、休眠、恢复。Daytona 的 CEO Ivan Burazin 在节目里抛出一组震撼数据:74% 的月增长、每天 85 万次 Agent 运行、背后是接近半百万颗 CPU 在转。这背后,藏着 AI Agent 下一阶段最关键的基础设施机会。