Claude Fable 5 很可能是最强模型,但它只属于有钱人
一个模型,24小时烧掉近1000美元,却让作者断言“这是下一个范式转移”。Claude Fable 5(以及被加了“安全带”的 Mythos)正在重新定义什么叫顶级 AI,但它的真正门槛,不是能力,而是钱包。
一个模型,24小时烧掉近1000美元,却让作者断言“这是下一个范式转移”。Claude Fable 5(以及被加了“安全带”的 Mythos)正在重新定义什么叫顶级 AI,但它的真正门槛,不是能力,而是钱包。
在这场来自 Google DeepMind 的分享里,一个反直觉的结论被反复强调:最强的模型,未必是最适合你的模型。Gemini 很强,但真正改变工程实践的,可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。
如果你还把AI当成一个“技术部门的事”,那这期Y Combinator的对话可能会让你坐立不安。视频里抛出的核心观点非常激进:在AI时代,CEO必须亲自成为Chief AI Officer,否则公司连“怎么定义自己”都会出问题。这不是口号,而是一套正在发生的现实。
所有人都在谈 Agentic Loops,但真正把它用对的人少之又少。更反直觉的是:它看起来越“自动化”,越可能让你偏离目标、疯狂烧 token。本期 Greg Isenberg 访谈中,Ross Mike 讲清了一个残酷事实——今天最靠谱的,可能还是人。
很多人以为 AI Agent 的关键在模型、在工具,Ras Mic 却反着来:真正拉开差距的,是你怎么“喂”模型。这个视频里,他拆解了自己每天都在用的3个技能,以及一个被严重误解的 agents.md 文件,用 53 个 token 干掉 900 多个 token,直接把上下文窗口变成生产力。
当所有人都在谈论AGI、模型规模和算力军备竞赛时,Benedict Evans却抛出一个让人不安又兴奋的类比:今天的AI,更像1997年的互联网。真正的颠覆不在模型本身,而在我们还没想清楚的问题里。
大多数人还在争论模型参数和推理速度时,Cloudflare 的工程师却抛出一个更激进的观点:真正限制 AI Agent 的,不是模型,而是计算原语本身。Eval++,被他们称为“下一代 compute primitive”,正在悄悄改变 AI 系统该怎么构建。
如果你还在为“该用哪个大模型”纠结,那你已经落后了。Arize AI 的 Dat Ngo 直言:当 LLM 进入生产环境,真正决定成败的不是模型能力,而是你有没有把可观测、评估和实验这三件事做对。这场分享,把行业最容易忽略、却最致命的问题摊在了桌面上。
如果让 AI Agent 真正走向商业世界,它们迟早要自己下单、付款、结算。但 Stripe 的 Steve Kaliski 在这场演讲里抛出一个反直觉的结论:问题不在于“机器人能不能付钱”,而在于“我们有没有把支付基础设施拆对”。这是一篇每个做 Agent、平台和工具的人都该读完的文章。
大多数人做 Agent 界面时,第一反应是“更快、更省 token”。但来自 Google Chrome DevTools 团队的一个结论恰恰相反:如果你的 Agent 不知道自己在干什么,再高的效率都是浪费。这场演讲,拆穿了很多 Agent 产品正在犯的设计错误。