文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

一个“会爆炸”的模型，如何逼出神经网络最关键的一跃

Karpathy 在 makemore 第二讲里，亲手演示了一个残酷事实：你以为还能靠统计和技巧硬撑的模型，会在规模一上来时彻底崩溃。而真正的转折点，不是调参，而是那一刻你被迫引入神经网络。

api_bot · 2022-09-12 · 42 阅读 · AI/人工智能

他用200行代码拆穿深度学习：为什么你必须自己写一遍反向传播

大多数人用 PyTorch 写神经网络，却从没真正“看见”梯度是怎么流动的。Andrej Karpathy 用一个叫 micrograd 的极简项目，亲手拆开了反向传播的黑箱：没有魔法、没有框架，只有链式法则。这支视频讲的不是“怎么用”，而是“为什么一切真的如此运作”。

api_bot · 2022-08-16 · 34 阅读 · AI/人工智能

模型训练神经网络

一个设计师用 TensorFlow 做了件狠事：让设计系统有了“AI 拼写检查”

设计系统最大的敌人不是规范不够，而是人类自己。一次 Config 演讲里，一位产品设计师展示了一个反直觉的原型：用 TensorFlow 给 Figma 做“拼写检查”，自动揪出设计系统里的隐形错误。这不是概念，而是已经跑起来的插件。

api_bot · 2022-05-19 · 61 阅读 · AI/人工智能

微调 AI应用模型训练机器学习计算机视觉

为什么说 Tesla AI Day 展示了通往真实智能的唯一路径

Lex Fridman 在解读 Tesla AI Day 时认为，这场发布会的震撼不在于单点技术突破，而在于首次完整展示了解决自动驾驶与通用机器人问题所需的“规模化工程全景”。从向量空间感知、多摄像头时序融合，到数据标注闭环与 Dojo 计算平台，Tesla 展示了一条难以复制的真实世界智能路线。

api_bot · 2021-08-20 · 42 阅读 · AI/人工智能

AI应用 GPU 模型训练机器学习强化学习

OpenAI 现场演示 Codex：从零分到写游戏，程序员真正慌了

这不是一次普通的产品发布，而是 OpenAI 当众展示：一个模型如何在一年内，从“代码准确率 0%”，进化到能写服务器、接 API、做小游戏。更反直觉的是，Ilya 亲口承认：这一切的原理，其实简单到令人不安。

api_bot · 2021-08-10 · 45 阅读 · AI/人工智能

模型训练神经网络代码生成大语言模型 Ilya Sutskever

一个Figma插件演讲，提前预演了“AI替你做设计”的未来

很多人以为“用自然语言生成设计”是这两年的新鲜事，但在2021年，Jordan Singer已经在Figma里把这件事跑通了。这场看似讲插件的分享，其实完整展示了：设计×代码×AI，是如何一步步把设计工具变成“可对话的创造机器”。

api_bot · 2021-05-24 · 42 阅读 · AI/人工智能

AI应用模型训练生成式AI 大语言模型提示工程

17M参数竟输给“半个模型”：SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型，被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里，它却暴露出一个致命短板：当关系、属性和实体一多，向量维度不够，模型会系统性失明。这不是调参问题，而是容量上限。

api_bot · 2021-05-10 · 42 阅读 · AI/人工智能

模型训练机器学习多模态 Embedding Transformer

他用Reddit训练AI审美，结果发现人类偏好有74%的天花板

OpenAI 学者 Jonathan Ward 做了一件反直觉的事：不用人工标注、不请外包标注员，而是直接拿互联网的“点赞”来训练奖励模型。结果很震撼——模型学会了人类偏好，但准确率卡在了 74%。这背后，藏着今天所有 RLHF 系统的真相与瓶颈。

api_bot · 2021-05-10 · 83 阅读 · AI/人工智能

微调模型训练机器学习强化学习 AI Agent

当模型学会“分裂人格”：OpenAI Scholar教你精准操控AI行为模式

如果你以为“多专家数据喂给模型，它自然就会学会分清谁是谁”，那这场 OpenAI Scholars Demo Day 的分享会直接打脸。Tyna Eloundou 用一个看似优雅、实则极具野心的框架，展示了：我们不仅能让模型学到多种行为，还能在需要时精准切换它们。

api_bot · 2021-05-10 · 54 阅读 · AI/人工智能

模型训练机器学习强化学习 AI Agent 神经网络

英语模型迁移到中文有多难？OpenAI一组Scaling Laws给了残酷答案

很多人直觉认为：只要模型够大、预训练够久，语言迁移自然水到渠成。但在 OpenAI Scholars Demo Day 上，Christina Kim 用一组冷静的数据告诉我们——预训练确实有用，但它的“性价比”，和语言、数据规模、模型大小强相关，而且远没有想象中均匀。

api_bot · 2021-05-10 · 54 阅读 · AI/人工智能

微调模型训练机器学习大语言模型预训练

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前