文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练 Sam Altman 对话AI 代码生成多模态开源模型提示工程

让AI代理真正“记住”：一场关于记忆、图与智能本质的思考

这是一场不太像传统技术分享的演讲。Mark Bain 从个人经历出发，把 AI Agent 的“记忆问题”放进更大的数学、物理和生物学框架中重新审视，并提出：只有把记忆当成结构化的关系网络，而不是简单存储，AI 才可能真正走向自治与协作。

api_bot · 2025-06-27 · 12 阅读 · AI/人工智能

Agent 记忆架构：让 AI 从“会说话”走向“可信任”的关键一步

这场演讲给出了一个清晰判断：未来 AI Agent 的竞争核心不在提示词，而在记忆。MongoDB 的 Richmond Alake 从工程实践出发，系统拆解了 Agent Memory 的定义、类型、架构模式以及检索的重要性，解释了为什么“没有记忆，就没有真正的 Agent”。

api_bot · 2025-06-27 · 24 阅读 · AI/人工智能

AI应用通用人工智能 AI Agent 神经网络检索增强生成

AI把代码写快了，却让评审崩溃：Graphite眼中的新开发范式

当AI大幅加速写代码的“内循环”，测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题，以及为什么未来的开发工具必须是“AI原生”的。

api_bot · 2025-06-27 · 20 阅读 · AI/人工智能

AI应用代码生成生成式AI AI工具模型部署

AI代理为何会“失控”？Jim Bennett给出的可观测性解法

在这场演讲中，Jim Bennett用一连串真实翻车案例和现场演示，解释了为什么AI代理天生不值得“信任”，以及如何通过“以评估为核心、以可观测性为驱动”的方法，把不可预测的AI系统驯服成可控的软件系统。

api_bot · 2025-06-27 · 23 阅读 · AI/人工智能

AI应用 AI Agent 检索增强生成幻觉对话AI

把LLM评估做到可规模化：一线工程师的实战方法论

这场演讲不是在讲“为什么要做评估”，而是直面一个更残酷的问题：当LLM真正进入生产环境，评估体系该如何跟上复杂度和速度？Dat Ngo结合大量真实落地经验，给出了一套围绕可观测性、信号设计和工程化迭代的评估方法论。

api_bot · 2025-06-27 · 33 阅读 · AI/人工智能

AI应用推理模型训练 AI Agent 检索增强生成

没有“标准答案”的RAG评测：open-rag-eval在解决什么真问题

这篇文章深入解读Vectara推出的开源项目 open-rag-eval，解释它为何要在没有“golden answers”的情况下评测RAG系统，以及背后的研究方法、关键指标和实际使用体验，帮助RAG开发者真正理解并优化自己的检索增强生成流水线。

api_bot · 2025-06-03 · 19 阅读 · AI/人工智能

开源模型检索增强生成幻觉大语言模型 LangChain

两周分析一万通销售电话：一个AI工程师的真实方法论

一次看似不可能的任务：两周内分析一万通销售电话。Charlie Guo 通过大语言模型、工程化系统设计和成本控制，把原本需要两年的人力工作，变成单人可完成的AI项目。这篇文章还原了其中最关键的技术决策、踩过的坑，以及对企业数据价值的深刻启示。

api_bot · 2025-06-03 · 19 阅读 · AI/人工智能

AI应用开源模型检索增强生成生成式AI 模型部署

当机器人“抢工作”：Twilio文档团队的真实AI协作实践

在这场来自 AI Engineer 世界博览会的演讲中，Elmer Thomas 和 Maria Bermudez 用一个真实而克制的案例，展示了AI如何不是取代人，而是成为小团队的放大器。他们分享了Twilio文档团队如何用多个单一职责AI Agent，解决高风险、低创造性的工作，并通过严密的护栏机制，把“AI会胡说八道”的风险降到可控范围。

api_bot · 2025-06-03 · 20 阅读 · AI/人工智能

AI应用 AI Agent AI工具幻觉提示工程