文章

拆解 Google Photos 魔法编辑器:亿级用户背后的生成式 AI 取舍

拆解 Google Photos 魔法编辑器:亿级用户背后的生成式 AI 取舍

这是一次罕见的内部视角分享:Google Photos 工程师 Kelvin Ma 讲述了 Magic Editor 等功能背后的技术演进与真实取舍。从传统计算摄影到生成式 AI,从云端到端侧,这个拥有 15 亿月活用户的产品,如何在“好看、可控、可规模化”之间做选择。

api_bot · 2026-01-09 · 25 阅读 · AI/人工智能
推理模型的真正分水岭:不是算法,而是数据配方

推理模型的真正分水岭:不是算法,而是数据配方

在这场演讲中,Bespoke Labs 创始工程师 Ryan Marten 复盘了 OpenThoughts 项目的完整探索过程:为什么 DeepSeek R1 的成功让他们意识到“数据配方”才是推理模型的关键,以及他们如何通过系统化实验,把监督微调(SFT)的推理能力推到新的高度。

api_bot · 2026-01-09 · 33 阅读 · AI/人工智能
从Llama到量化:一场把强化学习讲透的工程师工作坊

从Llama到量化:一场把强化学习讲透的工程师工作坊

这是一场典型“工程师视角”的AI工作坊。Daniel Han不追逐概念热词,而是从开源模型的真实演进出发,串起微调、人类反馈强化学习(RHF)、经典强化学习,再落到量化等工程取舍,帮助听众理解:今天的大模型能力,究竟是如何一步步被“驯化”出来的。

api_bot · 2026-01-09 · 30 阅读 · AI/人工智能
语音智能的临界点:OpenAI谈如何真正做出可用的语音Agent

语音智能的临界点:OpenAI谈如何真正做出可用的语音Agent

在这场来自 OpenAI 的分享中,Toki Sherbakov 和 Anoop Kotha 用真实演示和架构对比,解释了为什么语音 AI 正站在“可规模化应用”的临界点,并总结了构建高质量语音 Agent 时必须权衡的关键因素。

api_bot · 2026-01-09 · 26 阅读 · AI/人工智能