文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

把失败变成特性：Zapier两年AI Agent评估血泪史

Zapier团队分享了两年构建AI Agent平台的真实教训：难点不在模型，而在评估与反馈系统。本文还原他们如何把失败当作产品燃料，建立数据飞轮，并用工程化方法驯服不确定性的AI系统。

api_bot · 2025-06-30 · 82 阅读 · AI/人工智能

推理 AI Agent Claude 大语言模型提示工程

写代码的人不够了？Beyang Liu谈“驾驭编码代理”的新技能

Sourcegraph CTO Beyang Liu 认为，AI 编码代理不是更聪明的 Copilot，而是一种全新的软件交互范式。他从模型演进、产品设计到真实用户行为，拆解了“如何真正用好编码代理”这项正在浮现的新技能。

api_bot · 2025-06-30 · 78 阅读 · AI/人工智能

AI Agent 检索增强生成对话AI 大语言模型提示工程

当AI代理走向现实世界，安全边界该如何重建？

这场来自 AI Engineer 的分享，直面一个正在失控的问题：当 AI Agent 不再只是聊天，而是代表用户调用 API、操作系统、执行交易，安全体系还能沿用老一套吗？Bobby 和 Cam 用真实架构、失败隐患和现场 Demo，给出了基于开放标准的答案。

api_bot · 2025-06-30 · 56 阅读 · AI/人工智能

AI Agent 检索增强生成生成式AI AI安全大语言模型

当AI代理失控：Solomon Hykes谈如何用容器驯服Agent混乱

在这场演讲中，Docker 创始人、Dagger CEO Solomon Hykes 用十年平台工程经验，直面一个新问题：当大量 AI coding agent 开始“结对编程”，混乱如何避免？他的答案不是更聪明的提示词，而是更严格、可组合的运行环境。

api_bot · 2025-06-28 · 41 阅读 · AI/人工智能

AI Agent 大语言模型提示工程

“提示工程已死”：一场由评估器驱动的反直觉实验

Nir Gazit用一次真实的RAG机器人优化实验，挑战了“提示工程是一门手艺”的共识。他没有手工打磨prompt，而是用评估器和Agent把效果从0.4推到0.9，给出了一条更像工程、也更可扩展的路径。

api_bot · 2025-06-27 · 91 阅读 · AI/人工智能

模型训练机器学习 AI Agent 检索增强生成对话AI

为什么“事件”正在拖垮AI Agent：一次架构视角的反转

Temporal 工程师 Mason Egger 提出一个颠覆直觉的观点：事件驱动架构并不适合 AI Agent。通过天文学隐喻、真实事故经历和架构对比，他解释了为什么我们把“事件”放错了位置，以及“Durable Execution”为何可能成为下一代 AI Agent 的核心抽象。

api_bot · 2025-06-27 · 40 阅读 · AI/人工智能

AI Agent Claude 大语言模型

数据准备就绪是个神话：如何在混乱数据上构建可靠AI

这场演讲直指企业AI落地的最大幻觉：只要把数据“准备好”，AI就能可靠工作。Anushrut Gupta用大量真实场景说明，问题不在数据工具，而在AI不懂业务语言，并提出一种“像新人分析师一样成长”的Agentic语义层方案。

api_bot · 2025-06-27 · 57 阅读 · AI/人工智能

微调 AI应用 AI Agent 检索增强生成幻觉

GraphRAG如何重塑LLM上下文：微软的结构化记忆实验

微软研究院Graph团队负责人Jonathan Larson，通过一系列真实演示展示了GraphRAG如何用“结构化记忆”解决大模型在复杂代码库和长上下文中的根本瓶颈。这场分享不仅关乎检索增强生成，更揭示了AI Agent走向可执行软件工程的关键路径。

api_bot · 2025-06-27 · 72 阅读 · AI/人工智能

AI应用推理 AI Agent 开源模型代码生成

让AI代理真正“记住”：一场关于记忆、图与智能本质的思考

这是一场不太像传统技术分享的演讲。Mark Bain 从个人经历出发，把 AI Agent 的“记忆问题”放进更大的数学、物理和生物学框架中重新审视，并提出：只有把记忆当成结构化的关系网络，而不是简单存储，AI 才可能真正走向自治与协作。

api_bot · 2025-06-27 · 49 阅读 · AI/人工智能

AI Agent 幻觉大语言模型

为什么Agent的大脑需要一本“作战手册”：从本体论到Graph RAG的实战收益

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点：要让 AI Agent 更可靠，关键不只是更大的模型，而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG，他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

api_bot · 2025-06-27 · 74 阅读 · AI/人工智能

AI应用检索增强生成大语言模型向量数据库 LangChain

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前