Sora团队亲述:为何生成视频是通往AGI的关键一步
在这期No Priors播客中,OpenAI Sora项目的三位负责人首次系统阐述了他们的核心判断:高保真、可扩展的视频生成模型不仅是创作工具,更可能是通向通用人工智能的关键路径。本文提炼了他们关于世界模型、规模化方法与创作者反馈的独特洞见。
在这期No Priors播客中,OpenAI Sora项目的三位负责人首次系统阐述了他们的核心判断:高保真、可扩展的视频生成模型不仅是创作工具,更可能是通向通用人工智能的关键路径。本文提炼了他们关于世界模型、规模化方法与创作者反馈的独特洞见。
如果你还以为2023年的AI关键词是“全面起飞”,这13张图会让你重新校准认知:开源模型数量首次占据主流,但性能差距仍在;AI投资总体下滑,钱却疯狂涌向生成式AI;而所谓“全球AI竞赛”,在数据面前几乎成了一边倒的游戏。
这是一家仅成立一年的欧洲AI创业公司,却频繁被拿来与OpenAI对标。通过与Mistral AI CEO Arthur Mensch的深度对话,这期播客揭示了Mistral在开源、效率、分发与监管上的一整套反直觉选择,以及这些选择背后的技术与商业逻辑。
这期来自Y Combinator的《Light Cone》节目,通过对OpenAI Sora式生成视频的现场讨论,揭示了生成式AI从“科幻”走向工程现实的关键变化,也分享了YC创业公司在训练基础模型、控制成本和寻找应用落点时的真实经验。
Blackwell 不是一块更快的 GPU,而是一次对 AI 未来路线的公开摊牌:10–100 倍性能跃迁、万亿参数模型、机器人和空间计算,全都被打包进同一个平台。更重要的是,NVIDIA 正在悄悄改变自己的商业定位。
如果你还以为 ChatGPT 只是会聊天、写代码,那你已经落后了。就在 3 月中旬,OpenAI 把它装进了一台类人机器人,让 AI 看世界、理解场景、即时行动,还能解释“我为什么这么做”。这不是噱头,而是 AI 正式进入物理世界的关键一跃。
多数人聊大模型,只盯着参数、算力和 Transformer 架构,却忽略了一个更“底层”的事实:模型看到的世界,全是 Token。Andrej Karpathy 用一整期视频,从零实现 GPT Tokenizer,揭示了一个行业共识——Tokenizer,才是真正决定模型能力上限的隐秘开关。
大多数人还在讨论 Sora 会不会颠覆影视行业,但 OpenAI 的研究论文里,其实藏着一个更大的野心:视频生成只是表象,真正的目标是训练一个能“理解并模拟物理世界”的模型。这篇文章带你拆解 Sora 背后的关键技术路线,以及它为什么会让 AI 从业者坐立不安。
如果你以为AI最大的风险还在未来,那你已经落后现实一步了。就在2024年初,一通“AI拜登”的自动电话,直接干预了美国选举。FCC的反击、芯片禁令的攻防、以及AI全面渗透商业世界的速度,都在这一周集中爆发。
一家成立不到半年的欧洲创业公司,用一款开源模型让整个 AI 圈开始重新评估 GPT‑4 的护城河。Mistral 不只是在“跑分上赢了”,它正在用开源、MoE 架构和极具挑衅意味的发布方式,重塑 2024 年的大模型竞争逻辑。