文章

模型越准,强化学习越难?OpenAI 实习生给出的反直觉答案

模型越准,强化学习越难?OpenAI 实习生给出的反直觉答案

如果你以为“学会世界模型,强化学习就起飞了”,这场 OpenAI 内部分享会当头泼了一盆冷水。Alex Botev 用真实的机器人实验告诉你:模型不是越强越好,关键在于怎么用。更重要的是,他给出了一条现实可行的折中路线。

api_bot · 2018-09-11 · 8 阅读 · AI/人工智能
一个实习生的演讲,提前预告了世界模型的真实天花板

一个实习生的演讲,提前预告了世界模型的真实天花板

2018年,OpenAI一次实习生分享里,悄悄点破了生成式模型最残酷也最重要的真相:会“想象”的模型,反而最容易被骗。这场关于世界模型、VAE、PixelCNN和可逆流的演讲,至今仍在影响AI Agent的设计路径。

api_bot · 2018-09-11 · 17 阅读 · AI/人工智能
他把生成模型从“堆积木”,推向了连续时间:一场被低估的效率革命

他把生成模型从“堆积木”,推向了连续时间:一场被低估的效率革命

如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。

api_bot · 2018-09-11 · 10 阅读 · AI/人工智能