文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

从规模化到自我进化：强化学习为何成为自动编程的关键拐点

这场演讲由前Google PaLM与Gemini核心研究者Aakanksha Chowdhery分享，系统回顾了大语言模型从“规模化”到“推理能力”再到“自动编程”的演进脉络。她的核心观点是：当模型具备推理能力后，真正的瓶颈转向了如何通过强化学习，让模型在真实任务中自我改进。

api_bot · 2025-07-16 · 32 阅读 · AI/人工智能

推理强化学习大语言模型 Google Gemini

在AI刀战中活下来：产品真正的胜负手是什么

Brian Balfour 用25年创业与产品经验，拆解当下最残酷的AI产品竞争现实：模型不是护城河，速度也不再安全。真正的胜负，来自对未被满足需求的洞察，以及数据、功能与AI能力的系统化组合。

api_bot · 2025-07-14 · 47 阅读 · AI/人工智能

AI应用强化学习 AI Agent AI工具对话AI

从提示工程到AI红队：一位实践者的安全与能力边界之旅

这场演讲系统梳理了提示工程从“技巧”走向“方法论”的过程，并自然过渡到AI红队这一安全视角。演讲者结合自身从强化学习到LearnPrompting的经历，解释为什么理解模型能力边界，已经成为使用与部署大模型的必修课。

api_bot · 2025-07-14 · 31 阅读 · AI/人工智能

强化学习提示工程

Grock 4登场：别急着质疑马斯克，这次可能真不一样

Grock 4的发布再次把马斯克推到AI舞台中央。这篇文章梳理了发布会的关键细节、XAI自报成绩背后的争议，以及为什么ARC AGI测试的突破让一些分析师重新相信“不要押注马斯克会失败”。

api_bot · 2025-07-11 · 30 阅读 · AI/人工智能

模型训练强化学习通用人工智能提示工程 AI对齐

试着“打开黑箱”：Goodfire谈神经网络可解释性的未来

这场对话围绕一个核心问题展开：当大模型仍是“黑箱”，我们是否真的理解并信任它们？Goodfire 的 Eric Ho 分享了他们为何执着于研究神经网络内部机制、可解释性当前的真实进展，以及这一领域为何既充满希望又极其早期。

api_bot · 2025-07-08 · 33 阅读 · AI/人工智能

强化学习神经网络生成式AI Anthropic 大语言模型

推理与智能体其实是一件事：Will Brown谈Agentic Reasoners训练

Prime Intellect 的 Will Brown 认为，推理模型与 AI Agent 并非两条独立技术路线，而是同一问题的不同侧面。本次演讲从强化学习的复兴讲起，结合架构、奖励设计和玩具案例，揭示了训练“会行动的推理模型”为何正在变得可行，却依然充满挑战。

api_bot · 2025-07-07 · 47 阅读 · AI/人工智能

推理模型训练强化学习 AI Agent DeepSeek

当AI学会“作恶”：微软如何用红队Agent测试智能体的底线

在AI Agent快速走向生产环境的当下，微软在AI Engineer大会上展示了一个关键能力：让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示，解释它如何通过自动化攻击策略、评估与防护闭环，帮助工程师构建真正可被信任的AI应用。

api_bot · 2025-06-27 · 45 阅读 · AI/人工智能

强化学习 AI Agent 检索增强生成模型部署对话AI

Agentforce 3.0亮相：企业AI代理进入“规模化第二天”

Salesforce发布Agentforce 3.0，把企业AI代理从“能不能用”推进到“如何大规模稳定运行”。从可观测性、MCP互操作到扎克伯格的疯狂招募，这期视频勾勒出企业AI竞争正在发生的关键转向。

api_bot · 2025-06-26 · 28 阅读 · AI/人工智能

模型训练强化学习通用人工智能 AI Agent 多模态

从SFT到RFT：OpenAI如何系统化看待模型微调

这场由OpenAI工程师Ilan Bigio带来的分享，系统梳理了三种主流微调方式——SFT、DPO与RFT——以及它们各自解决的问题边界。与其把微调当成“最后的魔法”，他更强调一种工程化、循序渐进的思路：什么时候提示工程就够了，什么时候必须动用微调，以及如何避免投入巨大却收益有限。

api_bot · 2025-06-23 · 49 阅读 · AI/人工智能

微调模型训练强化学习提示工程 OpenAI

从GPT-3到Claude 4：Ben Mann谈模型进化、长程推理与安全边界

Anthropic联合创始人Ben Mann在No Priors播客中，回顾了从OpenAI到Anthropic的关键转折，系统讲述Claude 4的发布逻辑、长程任务能力的意义，以及为何AI安全必须成为模型公司的“核心业务”。

api_bot · 2025-06-12 · 37 阅读 · AI/人工智能

强化学习 Claude Anthropic AI安全大语言模型

共 178 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，3 周前