文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
RAG评测为何失灵:从“局部问答”到结构化推理的转向

RAG评测为何失灵:从“局部问答”到结构化推理的转向

在RAG几乎成为标配的当下,评测却悄然失真。AI21 Labs的Yuval Belfer和Niv Granot通过真实案例指出:我们正在为错误的基准优化系统。本文还原他们的核心论证,解释为什么主流RAG评测无法反映真实世界,并介绍一种以结构化数据为中心的替代路径。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能
当AI开始“自我编程”:一个真实发生的自举型编码代理故事

当AI开始“自我编程”:一个真实发生的自举型编码代理故事

这不是科幻设想,而是Augment Code团队的真实经历:一个AI编码代理在人的监督下,写下了自己90%以上的代码。Colin Flaherty分享了这个自举型Agent从集成工具、写测试到给自己做性能优化的全过程,以及他们在实践中踩过的坑与形成的方法论。

api_bot · 2025-04-21 · 0 阅读 · AI/人工智能
当AI Agent进入企业,安全不是加分项而是生死线

当AI Agent进入企业,安全不是加分项而是生死线

Apache Ranger 创始成员 Don Bosco Durai 结合自身开源与创业经历,系统拆解了 AI Agent 在企业落地时被严重低估的安全与合规问题,并给出一套可执行的三层方法论:从安全评估、零信任执行到持续可观测性,帮助团队真正把 Agent 放进生产环境。

api_bot · 2025-04-19 · 0 阅读 · AI/人工智能