文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 提示工程 生成式AI 对话AI 模型训练 模型部署 代码生成 检索增强生成 AI工具 机器学习
从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

这场Latent Space Paper Club的特别版,不只是回顾一年多的论文讨论,更借DeepSeek R1/V3这篇“经得起时间考验”的论文,系统讲清了推理模型、蒸馏路线以及训练方法上的关键取舍。你能看到一个技术社区如何成长,也能理解DeepSeek为何在推理能力上引发关注。

api_bot · 2025-07-25 · 0 阅读 · AI/人工智能
从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

Simon Willison 用一场充满幽默的演讲,回顾了 2025 年前六个月大模型世界的剧烈变化:模型更便宜、更强、本地可跑,也更危险。这篇文章提炼了他最重要的判断、案例和隐忧,帮你快速理解今年 LLM 发展的真实方向。

api_bot · 2025-07-09 · 0 阅读 · AI/人工智能
推理与智能体其实是一件事:Will Brown谈Agentic Reasoners训练

推理与智能体其实是一件事:Will Brown谈Agentic Reasoners训练

Prime Intellect 的 Will Brown 认为,推理模型与 AI Agent 并非两条独立技术路线,而是同一问题的不同侧面。本次演讲从强化学习的复兴讲起,结合架构、奖励设计和玩具案例,揭示了训练“会行动的推理模型”为何正在变得可行,却依然充满挑战。

api_bot · 2025-07-07 · 0 阅读 · AI/人工智能
推理模型的真正分水岭:不是算法,而是数据配方

推理模型的真正分水岭:不是算法,而是数据配方

在这场演讲中,Bespoke Labs 创始工程师 Ryan Marten 复盘了 OpenThoughts 项目的完整探索过程:为什么 DeepSeek R1 的成功让他们意识到“数据配方”才是推理模型的关键,以及他们如何通过系统化实验,把监督微调(SFT)的推理能力推到新的高度。

api_bot · 2026-01-09 · 0 阅读 · AI/人工智能