文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 提示工程开源模型多模态

神经网络如何学会画螺旋：一场直观到残酷的实验

Lex Fridman 通过 TensorFlow Playground 的可视化实验，展示了神经网络在不同结构与超参数下，如何逐步学会（或学不会）复杂数据分布。短短几分钟的视频，揭示了模型容量、特征工程与直觉理解之间的深刻联系。

api_bot · 2020-07-19 · 53 阅读 · AI/人工智能

模型训练机器学习神经网络深度学习监督学习

Sergey Levine谈机器人：通往通用智能的最艰难道路

在这期Lex Fridman播客中，机器人学与强化学习专家Sergey Levine系统阐述了他对通用人工智能的判断：真正的智能必须扎根于与真实世界的交互。本文提炼他关于探索、世界模型和机器人学习的核心洞见。

api_bot · 2020-07-14 · 53 阅读 · AI/人工智能

强化学习通用人工智能世界模型

她把GPT-2“拆开看大脑”：一场关于语法藏在哪里的大胆实验

很多人以为，大语言模型只是靠“统计词频”在蒙答案。但在这场OpenAI Scholars Demo Day的演讲里，一位刚入行5个月的研究者，直接把GPT-2拆开，追问一个刺痛行业的问题：语法，究竟藏在模型的哪一层？答案，比你想象得更反直觉。

api_bot · 2020-07-09 · 43 阅读 · AI/人工智能

模型训练神经网络生成式AI AI安全大语言模型

一句英语直接跑 GraphQL，这个 OpenAI Scholar 项目低估了多少人类中间层

大多数人以为“自然语言到数据库查询”只是把 NL 转成 SQL，但在 OpenAI Scholars Demo Day 上，有人直接跳过 SQL，把英语变成 GraphQL。更反直觉的是：难点不在模型，而在数据、验证和语言之间的“对齐”。这是一场关于语义解析边界的真实实验。

api_bot · 2020-07-09 · 8 阅读 · AI/人工智能

OpenAI 学者演示：一个奖励延迟，足以让强化学习彻底“迷路”

强化学习最怕什么？不是算力不够，也不是模型不深，而是奖励来得太晚。Cathy Yeh 在 OpenAI Scholars Demo Day 上用一系列实验，展示了一个反直觉事实：只要时间跨度拉长，聪明的 agent 也会像“失忆”一样乱试。这场分享的核心，是她如何用 Temporal Reward Transport（TRT）正面解决这个老大难问题。

api_bot · 2020-07-09 · 44 阅读 · AI/人工智能

强化学习深度学习