Claude Fable 5 很可能是最强模型,但它只属于有钱人
一个模型,24小时烧掉近1000美元,却让作者断言“这是下一个范式转移”。Claude Fable 5(以及被加了“安全带”的 Mythos)正在重新定义什么叫顶级 AI,但它的真正门槛,不是能力,而是钱包。
一个模型,24小时烧掉近1000美元,却让作者断言“这是下一个范式转移”。Claude Fable 5(以及被加了“安全带”的 Mythos)正在重新定义什么叫顶级 AI,但它的真正门槛,不是能力,而是钱包。
当社交媒体在刷“RAG is dead”时,大多数人以为这只是又一次技术口嗨。但在这场由 Turbopuffer 工程师 Kuba Rogut 分享的演讲里,一个更扎心的事实浮出水面:不是 RAG 失效了,而是它已经跟不上真正严肃的 AI 搜索需求了。
这一周的AI圈有点不对劲:Cursor不再只是写代码的工具,DeepSeek被反复拿来和Opus对标,而Anthropic似乎成了最“坐立不安”的那一方。这不是零散更新,而是一条正在成形的趋势线。
很多人以为“语义搜索”是写代码的终极形态,但这场基准测试给了所有人一记冷水:Claude Code 默认不用语义搜索,反而效果更稳。TurboPuffer 的 Kuba 用真实数据对比了语义检索与 agentic 搜索,结论远比你想象复杂。
如果你还把 AI 理解为“选一个最强模型就够了”,那这场 AI Engineer Melbourne 2026 的 Day 1 Keynote,几乎是冲着你来的。演讲者反复强调:模型只是开始,真正拉开差距的是系统、权衡,以及工程师如何使用它们。
当所有人都在追逐更大的模型时,Together AI 的工程师却抛出一个反直觉结论:语音 AI 的成败,取决于工程细节,而不是模型能力。这场分享把“好用的语音 Agent”为何如此之难,说得异常直白。
多数人还在拼模型参数时,最好的 AI Agent 已经换了赛道。Mardu Swanepoel 提出一个反直觉观点:决定 Agent 上限的,不是能力,而是设计模式。这场分享拆解了四个正在被 Cursor、Claude 等产品验证的关键机制。
很多人以为,代码模型的上限取决于参数规模。但 Cursor 和 Fireworks 在这期播客里反复强调:真正决定 RL 效果的,是你能不能造出一个“模型没法作弊”的世界。Composer 2 的训练故事,几乎是对整个 AI 应用圈的一次提醒。
你以为 AI Agent 会解放工程师,但现实恰恰相反。Bitly 工程负责人 Michael Richman 提出了一个新概念:FOMAT——Fear of Missing Agent Time。它正在悄悄吞噬工程师的注意力、精力,甚至创造力。这不是效率问题,而是一个全新的工作方式危机。
如果你只关注模型参数,这周你可能已经落伍了:真正的变化发生在 AI Agent 层。Claude 的一系列更新、Andrej Karpathy 加盟 Anthropic、OpenAI 把 Codex 推向“超级应用”,以及 Cursor 的自动化能力,正在重新定义谁才是开发者的主战场。