为何深度学习还不够:Alexa背后的AI推理困局
在这段对话中,Alexa首席科学家Rohit Prasad直言:深度学习仍然强大,但无法独自解决“推理”这一终极难题。他结合Alexa的真实场景,解释了为什么下一代AI必须跨越预测,走向更接近人类目标理解的推理能力。
在这段对话中,Alexa首席科学家Rohit Prasad直言:深度学习仍然强大,但无法独自解决“推理”这一终极难题。他结合Alexa的真实场景,解释了为什么下一代AI必须跨越预测,走向更接近人类目标理解的推理能力。
很多人只记得 OpenAI Five 在 Dota 2 里赢过职业战队,但在这场决赛收官时,OpenAI 做了一个更激进的决定:把已经“训练完成”的 AI,直接开放给全世界挑战。这不是炫技,而是一场关于 AI 如何走向现实世界的公开实验。
一场看似“普通”的Dota对局,却让无数AI研究者反复回看。不是因为OpenAI Five又赢了,而是因为它第一次被放进了一个极不完美的环境:和人类做队友。这场比赛,意外揭示了当AI不再单打独斗,真正的难题才刚刚开始。
2019年,OpenAI Five在舞台上用一局不到20分钟的比赛击败OG。真正震撼的不是“AI赢了职业选手”,而是它赢的方式:几乎没有个人秀,只有冷静、残酷、近乎机械的团队协作。这一局,成了AI从业者必须反复观看的样本。
2019年,OpenAI Five在Dota 2总决赛中拿下OG的第一局。很多人只记住了“AI赢了职业冠军”,但真正值得反复观看的,是这局比赛里暴露出的AI决策方式:冷静、残酷,而且几乎不受人类直觉影响。这不是一场表演赛,而是一堂给所有AI从业者上的公开课。
当Greg Brockman站在舞台上说出“我们不知道会发生什么”时,全场安静了。这不是一次AI稳赢的表演赛,而是人类第一次把一个靠强化学习“自学成才”的系统,推到世界冠军面前。输赢不重要,重要的是:AI第一次以一种近乎陌生智能的方式,公开面对人类最顶级玩家。
在这期Lex Fridman播客中,OpenAI联合创始人Greg Brockman回顾了自己从学生时代到创建OpenAI的关键经历,并系统阐述了他对AGI、深度学习、公司治理与技术风险的看法。这是一场关于技术理想、现实约束与长期责任的深度对话。
这是一堂由Lex Fridman在MIT讲授的深度强化学习入门课,却远不只是技术概览。它系统梳理了强化学习的核心框架,也坦率揭示了从游戏到真实世界之间的巨大鸿沟,帮助读者理解Deep RL真正困难和真正迷人的地方。
Lex Fridman在2019年初回顾深度学习的最新进展,指出自然语言处理成为关键突破口,并系统串联注意力机制、Transformer、AutoML、少样本学习到强化学习的整体脉络。这是一份理解现代AI如何走向通用能力的路线图。
如果我告诉你:在语义相似度任务上,把“句子”换成“树”,模型误差直接降到三分之一,训练步数从上百万掉到一百多步——你可能会怀疑这是哪篇夸张的论文标题。但这不是论文,是 2018 年 OpenAI Scholars Demo Day 的真实实验结果。