AI突然会做数学了,这可能才是通向AGI最危险的一步
几年前还被群嘲“连小学算术都算不对”的大模型,如今已经开始碰触研究级数学,甚至参与解决42年未解的问题。OpenAI最新一期播客给出了一个极具冲击力的信号:AI真正的拐点,可能不是写作、画画,而是数学。
几年前还被群嘲“连小学算术都算不对”的大模型,如今已经开始碰触研究级数学,甚至参与解决42年未解的问题。OpenAI最新一期播客给出了一个极具冲击力的信号:AI真正的拐点,可能不是写作、画画,而是数学。
很多AI团队以为,模型效果不好,是模型不够强。Phil Hetzel却在这次分享里泼了一盆冷水:真正拖垮AI Agent落地的,往往是你根本没建好的Eval平台。这不是工具问题,而是一个被严重低估的系统级难题。
董事会逼CEO“再多上点AI”,但Box CEO在a16z却直接泼冷水:AI本身解决不了大公司的核心问题。真正拖垮巨头的,不是模型能力,而是组织、架构和现实世界的复杂性。这场对话,戳破了硅谷最流行的幻觉。
你以为 MCP 的痛点在模型、在插件,其实最致命的是登录。Garrett Galow 在这场分享里抛出一个反直觉观点:真正拖慢 AI 团队的,不是算力,而是每一次重复的认证。这次,他给出了一个几乎“无感”的解决方案。
当白宫动用《国防生产法》讨论电网,当“每1吉瓦算力≈一座核电站”被反复提起,AI的战场已经不只在芯片和模型上。DeepSeek的最新模型发布,意外把美国电力系统、云巨头和地缘政治连成了一条线。
一个看似失败的并购,被一句“我们去太空找电”盖过了风头。TBPN 这期视频把 Meta 放在显微镜下:一边是被中国叫停的 Manus 交易,另一边是极度反直觉的太空太阳能押注。更意外的是,这期节目真正的“方法论”,藏在一个走红的 Golden Retriever 心态里。
Google DeepMind 悄悄干了一件“反直觉”的事:没有堆参数、没有锁生态,却用 Gemma 4 把开源模型直接送进榜单前六。从 31B 多模态到能跑在设备端的小模型,这次更新释放了一个强烈信号——下一轮 AI 竞争,不再只属于巨无霸模型。
如果你以为 Physical AI 只是“自动驾驶的另一个名字”,这期播客会直接打脸。Applied Intuition 把今天的物理世界,比作 Android 和 iOS 出现之前的手机市场——混乱、割裂、每家都在重复造轮子。而他们正在做的,是一个覆盖空、地、海的“自治操作系统”,而且几乎不允许出错。
GitHub 在扩展自家远程 MCP Server 时,踩到的坑远比“模型不够聪明”要多。上下文爆炸、工具频繁失败、安全像幽灵一样缠身——Sam Morrow 用一场演讲揭开了一个反直觉真相:真正限制 AI 系统规模的,往往不是模型能力,而是工程现实。
MCP 被捧成 AI Agent 时代的“新 API”,但 Anthropic 的工程师却在台上直言:企业真正卡住的,从来不是协议本身。这场演讲抛出一个反直觉结论——如果没有网关,MCP 在企业里几乎注定失控。