给 Agent 全量 API 是个坏主意:Cloudflare 的反直觉答案
把所有 API 一股脑喂给 Agent,看起来很聪明,实际上却是灾难。Cloudflare 的 Matt Carey 用一次真实的工程踩坑告诉你:上下文窗口不是瓶颈,思路才是。
把所有 API 一股脑喂给 Agent,看起来很聪明,实际上却是灾难。Cloudflare 的 Matt Carey 用一次真实的工程踩坑告诉你:上下文窗口不是瓶颈,思路才是。
GPT‑5.5(内部代号 Spud)终于来了,但它没有用“智商碾压”震撼所有人。恰恰相反,这次测试最反直觉的发现是:你几乎感觉不到它变了,可一旦算清成本、放进真实工作流,它可能正在悄悄改变 AI 从业者的竞争方式。
在这场超长 AI Coding 工作坊里,Matt Pocock 抛出了一个反直觉结论:多数 AI 编程翻车,不是因为模型太弱,而是工程师根本没理解 LLM 的“怪癖”。从“聪明区/愚蠢区”到“记忆只有几分钟的失忆症”,这是一套专为真实工程师准备的 AI 协作方法论。
如果你还把 AI 当成 Copilot、当成“效率工具”,那你已经落后一个时代了。Y Combinator 合伙人 Diana 在这期视频里抛出一个更激进的判断:AI 不是工具,而是公司运行的操作系统,组织结构、工程方式、管理层级都要被彻底推翻。
OpenAI 在一周内同时发布 GPT‑5.5 和 ChatGPT Images 2,看似例行升级,却在真实对战中暴露出一个反直觉结论:它不再追求“最聪明”,而是开始全面服务“能干活的人”。Peter Yang 用 4 个实测,给了一个极其清醒的判断。
Every 团队提前内测 GPT‑5.5 三周,结论只有一句话:这是一次真正的能力跃迁。它还没到“高级工程师”水平,却已经把所有对手甩在身后;写作没那么有性格,却意外成了商业场景的利器。更重要的是,它正在重新定义什么叫“日常工作模型”。
如果你以为AI的下一步只是更大的模型,那这期TBPN会直接打脸:SpaceX把算力押给Cursor,Imagen 2.0突然“有审美”了,而GPU、代码生成、图像模型正在被重新排位。这不是零散新闻,而是一次产业重组的实时画面。
当大多数人还在讨论“多智能体怎么写Prompt”时,一位服务上千家律所的CTO抛出一个刺耳结论:真正复杂的Agent,失败不是因为模型不够强,而是因为你把一切都塞进了聊天框。这场演讲,几乎是在给整个Agent行业泼冷水。
这场对谈抛出一个反直觉观点:在生成式 AI 时代,真正的“创作者”可能不是你。模型更像一场永远即兴的演出,而人类,正在从创作者变成高级观众与合作者。这不是贬低,而是一次创作范式的重置。
如果你还在担心“让大模型写代码是不是自找麻烦”,Sunil Pai 这场演讲会让你重新站队。他在台上用真实系统演示了一种叫 Code Mode 的思路:不是让模型生成文本,而是直接生成可执行、可约束、可观察的代码——结果不但更稳,还更安全。