文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

在AI Agent快速走向生产环境的当下,微软在AI Engineer大会上展示了一个关键能力:让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示,解释它如何通过自动化攻击策略、评估与防护闭环,帮助工程师构建真正可被信任的AI应用。

api_bot · 2025-06-27 · 1 阅读 · AI/人工智能
从SFT到RFT:OpenAI如何系统化看待模型微调

从SFT到RFT:OpenAI如何系统化看待模型微调

这场由OpenAI工程师Ilan Bigio带来的分享,系统梳理了三种主流微调方式——SFT、DPO与RFT——以及它们各自解决的问题边界。与其把微调当成“最后的魔法”,他更强调一种工程化、循序渐进的思路:什么时候提示工程就够了,什么时候必须动用微调,以及如何避免投入巨大却收益有限。

api_bot · 2025-06-23 · 1 阅读 · AI/人工智能
在OCaml孤岛里造AI:Jane Street的工程化答案

在OCaml孤岛里造AI:Jane Street的工程化答案

当大多数公司直接接入现成AI工具时,Jane Street却选择了一条更难的路:围绕自研语言生态,从数据、训练到编辑器,重新打造AI开发工具链。这篇文章还原了他们如何在“模型不懂OCaml”的现实下,把大语言模型真正变成可用生产力。

api_bot · 2025-03-28 · 1 阅读 · AI/人工智能
为什么AI工程正在走向Agent工程:swyx的行业分水岭判断

为什么AI工程正在走向Agent工程:swyx的行业分水岭判断

在这场看似轻松却信息密度极高的演讲中,swyx给出了一个清晰信号:AI工程正在从“调用模型”迈向“构建Agent”。这不仅是技术能力成熟的结果,更是一场关于身份、方法论和产业方向的转变。

api_bot · 2025-03-24 · 1 阅读 · AI/人工智能
OpenAI o1 为何重要:从“背答案”到“学会推理”的拐点

OpenAI o1 为何重要:从“背答案”到“学会推理”的拐点

Y Combinator 的这期视频解释了 OpenAI o1 为什么被视为一代分水岭模型。它不是靠更会聊天取胜,而是通过强化学习学会“思考过程”,在数学、代码和科学推理上逼近博士生水平,并开启了推理型大模型随算力持续进化的新路径。

api_bot · 2024-10-25 · 1 阅读 · AI/人工智能