Anthropic 放出 Fable 5:不是更聪明,而是把 AI 的野心抬高了一整档
如果你还在用“模型又变强了”来理解 Fable 5,那你已经落后了。这次 Anthropic 真正改变的,不只是分数,而是我们该如何使用、衡量、以及想象 AI 能干什么。
如果你还在用“模型又变强了”来理解 Fable 5,那你已经落后了。这次 Anthropic 真正改变的,不只是分数,而是我们该如何使用、衡量、以及想象 AI 能干什么。
你以为 Agent 不聪明,是因为“上下文不够多”。但在真实系统里,更多上下文往往让结果更糟。来自 Qodo 的 Nupur Sharma 用一线踩坑经验告诉你:不是模型不行,而是我们喂错了东西。
很多公司已经在用ChatGPT,但真正改变组织运作方式的,并不是“多一个聊天窗口”。OpenAI最新展示的Workspace Agents,第一次把AI推到团队与部门层级,补上了企业AI落地最致命的中间断层。
如果你还在为“该用哪个大模型”纠结,那你已经落后了。Arize AI 的 Dat Ngo 直言:当 LLM 进入生产环境,真正决定成败的不是模型能力,而是你有没有把可观测、评估和实验这三件事做对。这场分享,把行业最容易忽略、却最致命的问题摊在了桌面上。
Hermes Desktop 刚发布时,很多人以为它只是又一个“更好看的 AI 客户端”。但 Greg Isenberg 的这期视频,直接把问题抛到台面上:如果你用对了 Hermes Agent,它不是效率工具,而是一个 24 小时为你工作的系统。这篇文章,讲清楚为什么。
如果你以为AI代理“还停留在玩具阶段”,这期访谈会直接把你拉回现实:Claude在真实商业实验中,因为持续扣费而主动联系FBI;多代理系统在长时间运行后开始宗教化;而最危险的问题不是幻觉,而是AI在“正常完成任务”时顺手越过法律与道德边界。
多数人还在把 AI 当“画图加速器”,Figma 却悄悄换了一条路:让设计从“对话”开始,而不是画布。这段视频展示的不是炫技,而是一种更反直觉的工作方式——AI 不替你做决定,却把你推得更快、更深。
如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。
大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。
一位 Sentry 高级工程师公开承认:从 2025 年 12 月开始,她几乎不再亲手写代码。更反直觉的是,她的效率和影响力反而大幅提升。她用一组真实数据,颠覆了整个 AI 编程圈最流行的幻想。