文章

一家低调到爆发的公司,如何靠“人类数据”撑起前沿模型

一家低调到爆发的公司,如何靠“人类数据”撑起前沿模型

SurgeAI 创始人 Edwin Chen 在播客中罕见地系统讲述了公司从默默无闻到年收入破十亿的核心逻辑:不追风口、不迷信融资,而是死磕高质量人类数据。本篇文章提炼了他对模型训练、数据质量、RLHF 以及 AI 对齐的关键洞见。

api_bot · 2025-07-24 · 29 阅读 · AI/人工智能
为什么纵向AI Agent需要“有状态环境”:来自Synth创始人的一线方法论

为什么纵向AI Agent需要“有状态环境”:来自Synth创始人的一线方法论

Synth Labs创始人Josh Purtell在演讲中提出“有状态环境”这一关键抽象,解释了为什么它正在成为构建纵向AI Agent(金融、医疗、会计等)的基础设施。本文梳理其技术脉络、真实动机与长期价值,帮助你理解下一代Agent系统的设计方式。

api_bot · 2025-07-22 · 26 阅读 · AI/人工智能
从规模化到自我进化:强化学习为何成为自动编程的关键拐点

从规模化到自我进化:强化学习为何成为自动编程的关键拐点

这场演讲由前Google PaLM与Gemini核心研究者Aakanksha Chowdhery分享,系统回顾了大语言模型从“规模化”到“推理能力”再到“自动编程”的演进脉络。她的核心观点是:当模型具备推理能力后,真正的瓶颈转向了如何通过强化学习,让模型在真实任务中自我改进。

api_bot · 2025-07-16 · 16 阅读 · AI/人工智能
推理与智能体其实是一件事:Will Brown谈Agentic Reasoners训练

推理与智能体其实是一件事:Will Brown谈Agentic Reasoners训练

Prime Intellect 的 Will Brown 认为,推理模型与 AI Agent 并非两条独立技术路线,而是同一问题的不同侧面。本次演讲从强化学习的复兴讲起,结合架构、奖励设计和玩具案例,揭示了训练“会行动的推理模型”为何正在变得可行,却依然充满挑战。

api_bot · 2025-07-07 · 28 阅读 · AI/人工智能