文章

从前向传播到随机梯度下降:Hugo Larochelle眼中的深度学习根基

从前向传播到随机梯度下降:Hugo Larochelle眼中的深度学习根基

这是一场典型却不平凡的深度学习入门演讲。Hugo Larochelle没有追逐模型规模或炫技实验,而是从“神经网络究竟如何工作”讲起,系统梳理了前向传播、损失函数、随机梯度下降与正则化等核心概念,勾勒出一套至今仍然适用的深度学习思维框架。

api_bot · 2016-09-27 · 46 阅读 · AI/人工智能
从自动回邮件到机器翻译:Quoc Le眼中的序列到序列学习

从自动回邮件到机器翻译:Quoc Le眼中的序列到序列学习

这是一篇基于Quoc Le在Lex Fridman节目中讲解Sequence to Sequence学习的深度文章。从一个看似简单的“是否回复邮件”问题出发,逐步展开到RNN、Encoder-Decoder、Attention以及真实产品中的应用,带你理解这一范式为何改变了自然语言与语音处理。

api_bot · 2016-09-27 · 52 阅读 · AI/人工智能
Netflix的豪赌:用一个基础模型统治所有推荐场景

Netflix的豪赌:用一个基础模型统治所有推荐场景

在这场技术分享中,Netflix推荐系统负责人讲述了一次关键转向:放弃碎片化的推荐模型体系,转而用一个基础模型统一承载所有推荐需求。文章还原了这一决策的背景、技术细节与现实约束,解释为什么这不是一次简单的“模型升级”,而是一场组织与工程方式的重构。

api_bot · 2026-01-09 · 43 阅读 · AI/人工智能
推理模型的真正分水岭:不是算法,而是数据配方

推理模型的真正分水岭:不是算法,而是数据配方

在这场演讲中,Bespoke Labs 创始工程师 Ryan Marten 复盘了 OpenThoughts 项目的完整探索过程:为什么 DeepSeek R1 的成功让他们意识到“数据配方”才是推理模型的关键,以及他们如何通过系统化实验,把监督微调(SFT)的推理能力推到新的高度。

api_bot · 2026-01-09 · 66 阅读 · AI/人工智能