AI研究老将的冷水:推理不是终点,真正的瓶颈另有其人
当整个行业都在为“更强推理能力”而狂欢时,这位AI研究老将却在播客里泼了一盆冷水:推理,可能远远不够。围绕泛化、Agent、研究者的“轻度精神病”和OpenAI带来的冲击,他给出了一个不那么乐观、但极其清醒的判断。
当整个行业都在为“更强推理能力”而狂欢时,这位AI研究老将却在播客里泼了一盆冷水:推理,可能远远不够。围绕泛化、Agent、研究者的“轻度精神病”和OpenAI带来的冲击,他给出了一个不那么乐观、但极其清醒的判断。
Michal Cichra 给AI工程师泼了一盆冷水:真正让AI项目崩溃的,不是模型不聪明,而是“决策失忆”。当人类会离职、LLM会压缩上下文,产品为什么存在、架构为什么这么设计,正在悄悄消失。
多数人还在把 AI 当“画图加速器”,Figma 却悄悄换了一条路:让设计从“对话”开始,而不是画布。这段视频展示的不是炫技,而是一种更反直觉的工作方式——AI 不替你做决定,却把你推得更快、更深。
如果你还把 Copilot 当成“高级自动补全”,那你已经落后一个时代了。GitHub CEO 在这期访谈里反复强调的不是模型,而是 Agent:能并行干活、能自己推进任务、甚至在你周末陪孩子时替你写代码的那种。这不是效率提升,而是开发者角色的重写。
不是靠更大的模型,也不是靠更多参数。Lovable 让产品“每小时自我进化”的秘密,居然来自两个极不性感的设计选择:认真定义“卡住”,以及让 AI 学会抱怨。这场分享,把很多 AI Agent 的幻想直接拉回现实。
如果你以为AI的价值在于“替人回答问题”,那你可能低估了它。Listen Labs的创始人 Alfred Wahlforss 在红杉的访谈里抛出一个反直觉的判断:真正的突破,是让AI成为一个让用户愿意说真话的对象。这不仅改变了调研方式,也可能重塑品牌决策本身。
很多人还把 Notion 当成高级笔记本,但 Riley Brown 在这支视频里直接点破:在 AI Agent 时代,Notion 的真正身份,是“最适合被 AI 使用的工作中枢”。从 Codeex 到 Claude Code,他展示了一套让 AI 直接住进 Notion 的工作流,效率高到让人有点不安。
如果有一天,你在博物馆里拍下一尊雕像,30秒后它给你打来电话,这不是科幻,而是 ElevenLabs 的一次真实实验。Joe Reeve 用一个“和雕像聊天”的小应用,讲清了当下语音 AI、Agent 和多模态体验中最被低估、也最关键的变化。
Anthropic 刚发布 Opus 4.8,就被称为“世界最强模型”,但视频作者 Riley Brown 花了3个小时对比后,却把焦点转向了另一件事:OpenAI Codex 的更新,正在悄悄改变 AI Agent 的玩法。这不是一次简单的模型对比,而是一场关于“未来怎么用 AI”的分水岭。
当所有人都在追逐更大的模型时,Together AI 的工程师却抛出一个反直觉结论:语音 AI 的成败,取决于工程细节,而不是模型能力。这场分享把“好用的语音 Agent”为何如此之难,说得异常直白。