文章

当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

在AI Agent快速走向生产环境的当下,微软在AI Engineer大会上展示了一个关键能力:让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示,解释它如何通过自动化攻击策略、评估与防护闭环,帮助工程师构建真正可被信任的AI应用。

api_bot · 2025-06-27 · 45 阅读 · AI/人工智能
从RAG到多智能体:LlamaIndex的生产级Agent设计模式

从RAG到多智能体:LlamaIndex的生产级Agent设计模式

LlamaIndex 开发者关系副总裁 Laurie Voss 用 15 分钟浓缩了一个关键信息:真正能在生产中跑起来的 Agent,靠的不是“更聪明的模型”,而是扎实的设计模式。这场演讲从 RAG 的必要性讲起,逐步引出链式、路由和编排式等 Agent 架构,给出了一套可复用的方法论。

api_bot · 2025-06-27 · 40 阅读 · AI/人工智能
AI代理为何会“失控”?Jim Bennett给出的可观测性解法

AI代理为何会“失控”?Jim Bennett给出的可观测性解法

在这场演讲中,Jim Bennett用一连串真实翻车案例和现场演示,解释了为什么AI代理天生不值得“信任”,以及如何通过“以评估为核心、以可观测性为驱动”的方法,把不可预测的AI系统驯服成可控的软件系统。

api_bot · 2025-06-27 · 42 阅读 · AI/人工智能
把“机器人前台”做成真人对话:实时视频AI的工程真相

把“机器人前台”做成真人对话:实时视频AI的工程真相

这场由 Pipecat 与 Tavus 联合分享的演讲,罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行,以及真正的难点不在模型本身,而在编排与部署。读完你会理解,一个 600 毫秒响应的对话式视频系统,究竟是怎样被搭出来的。

api_bot · 2025-06-27 · 45 阅读 · AI/人工智能
从提示到环境:为什么“上下文工程”正在重塑AI能力边界

从提示到环境:为什么“上下文工程”正在重塑AI能力边界

这期《AI Daily Brief》提出了一个正在快速升温的新概念:上下文工程。它不再纠结一句提示词怎么写,而是关注如何为大模型和智能体持续、系统地提供正确的信息环境。文章将解释它为何出现、与提示工程的本质差异,以及它为什么可能成为下一阶段AI应用的核心能力。

api_bot · 2025-06-26 · 33 阅读 · AI/人工智能
下一个千亿美金公司,可能只有100人:Twitch创始人赌上家庭机器人

下一个千亿美金公司,可能只有100人:Twitch创始人赌上家庭机器人

Kyle Vogt 说了一句很“狂”的话:未来五年,没有家用机器人的房子会显得很奇怪。更狠的是,他判断下一个千亿美金公司,可能诞生在一个不到100人的小团队里。这不是畅想,而是他在卖掉 Cruise、踩过无数坑之后,对 AI、机器人和创业规模的最新下注。

api_bot · 2025-06-25 · 22 阅读 · AI/人工智能
从美元到GPT-3.5:顶级设计师说,AI真正的货币不是技术而是信任

从美元到GPT-3.5:顶级设计师说,AI真正的货币不是技术而是信任

在 Figma Config 2025 的舞台上,Jude Sue 抛出一个让全场安静下来的判断:无论是社交、加密货币,还是大语言模型,真正决定产品生死的,从来不是技术本身,而是“信任”。这场演讲,把美元、Airbnb、GPT-3.5 和自动驾驶放进同一条逻辑链,揭示了 AI 时代最被低估的设计变量。

api_bot · 2025-06-25 · 33 阅读 · AI/人工智能