文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
Agent 记忆架构:让 AI 从“会说话”走向“可信任”的关键一步

Agent 记忆架构:让 AI 从“会说话”走向“可信任”的关键一步

这场演讲给出了一个清晰判断:未来 AI Agent 的竞争核心不在提示词,而在记忆。MongoDB 的 Richmond Alake 从工程实践出发,系统拆解了 Agent Memory 的定义、类型、架构模式以及检索的重要性,解释了为什么“没有记忆,就没有真正的 Agent”。

api_bot · 2025-06-27 · 1 阅读 · AI/人工智能
AI代理为何会“失控”?Jim Bennett给出的可观测性解法

AI代理为何会“失控”?Jim Bennett给出的可观测性解法

在这场演讲中,Jim Bennett用一连串真实翻车案例和现场演示,解释了为什么AI代理天生不值得“信任”,以及如何通过“以评估为核心、以可观测性为驱动”的方法,把不可预测的AI系统驯服成可控的软件系统。

api_bot · 2025-06-27 · 0 阅读 · AI/人工智能
把LLM评估做到可规模化:一线工程师的实战方法论

把LLM评估做到可规模化:一线工程师的实战方法论

这场演讲不是在讲“为什么要做评估”,而是直面一个更残酷的问题:当LLM真正进入生产环境,评估体系该如何跟上复杂度和速度?Dat Ngo结合大量真实落地经验,给出了一套围绕可观测性、信号设计和工程化迭代的评估方法论。

api_bot · 2025-06-27 · 1 阅读 · AI/人工智能
没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

这篇文章深入解读Vectara推出的开源项目 open-rag-eval,解释它为何要在没有“golden answers”的情况下评测RAG系统,以及背后的研究方法、关键指标和实际使用体验,帮助RAG开发者真正理解并优化自己的检索增强生成流水线。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能
两周分析一万通销售电话:一个AI工程师的真实方法论

两周分析一万通销售电话:一个AI工程师的真实方法论

一次看似不可能的任务:两周内分析一万通销售电话。Charlie Guo 通过大语言模型、工程化系统设计和成本控制,把原本需要两年的人力工作,变成单人可完成的AI项目。这篇文章还原了其中最关键的技术决策、踩过的坑,以及对企业数据价值的深刻启示。

api_bot · 2025-06-03 · 0 阅读 · AI/人工智能
当机器人“抢工作”:Twilio文档团队的真实AI协作实践

当机器人“抢工作”:Twilio文档团队的真实AI协作实践

在这场来自 AI Engineer 世界博览会的演讲中,Elmer Thomas 和 Maria Bermudez 用一个真实而克制的案例,展示了AI如何不是取代人,而是成为小团队的放大器。他们分享了Twilio文档团队如何用多个单一职责AI Agent,解决高风险、低创造性的工作,并通过严密的护栏机制,把“AI会胡说八道”的风险降到可控范围。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能