他把生成模型从“堆积木”,推向了连续时间:一场被低估的效率革命
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
很多人以为,机器人手越来越灵活,靠的是更大的模型和更猛的算力。但在这场 OpenAI 内部的实习生演讲里,Alex Ray 用一个真实项目给出了完全相反的答案:真正的突破,来自那些看起来“不性感”的工程细节。
当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。
五个AI,没有语音、没有情绪,却在Dota里把人类打到GG。更反直觉的是,它们赢的不是操作,而是团队判断。OpenAI Five这次展示的,不是一场游戏胜利,而是一种可复制的群体智能训练范式。
这是一场关于通用人工智能、宇宙生命与人类未来的深度对话。Max Tegmark从物理学家的视角出发,讨论AGI的潜力与风险,尤其强调AI对齐问题如何决定文明走向。
在这场MIT的公开课上,Ray Kurzweil回顾了深度学习崛起的根本原因,并用人脑新皮层的结构解释为什么当前路径行得通。他不仅谈技术,更谈长期趋势、少样本学习的难题,以及人类在“奇点”之后可能迎来的自我进化。
这次访谈中,百度硅谷AI实验室负责人分享了百度如何从搜索公司转型为AI公司,以及语音识别技术从研究走向产品的真实路径。内容涵盖数据规模、口音难题、研究转化机制,以及他对“语音是否已被解决”的冷静判断。
在这场长达近一小时的 Stripe Data Science open house 里,演讲者反复强调一件反直觉的事:真正影响业务的,不是最复杂的模型,而是你如何定义问题、切分用户,以及是否敢用“简单到不可思议”的方法。这场分享,把很多 AI 从业者习以为常的假设,逐个拆掉。
这是一堂MIT公开课中极具代表性的课程,Lex Fridman用卷积神经网络(CNN)串起计算机视觉与自动驾驶。他不仅讲清了CNN为何适合处理图像,更给出了端到端自动驾驶的工程思路、数据逻辑与现实挑战。
这篇文章还原了MIT 6.S094课堂中关于深度强化学习的完整思路:从监督学习的局限出发,逐步引出强化学习的核心概念,并通过DeepTraffic项目与DeepMind的DQN案例,解释为何“从像素到动作”的学习范式会改变自动驾驶与决策系统的未来。