文章

“AI First”不是裁员口号,而是一场重新定义工作的竞赛

“AI First”不是裁员口号,而是一场重新定义工作的竞赛

这期《AI Daily Brief》围绕一个被反复误解的问题展开:AI First 是否意味着用 AI 取代人类?通过解读 Tim O’Reilly 的文章与多个具体案例,视频给出了一个更具建设性的答案:真正的 AI First,是用 AI 放大人的能力,创造过去做不到的事情。

api_bot · 2025-06-06 · 13 阅读 · AI/人工智能
AI 原生开发的四次角色迁移:从写代码的人到管理智能的系统

AI 原生开发的四次角色迁移:从写代码的人到管理智能的系统

Patrick Debois 在这场演讲中提出了“AI 原生开发”的四种核心模式,解释了生成式 AI 如何系统性地改变软件工程师的工作重心:从写代码,到管理代理、表达意图、探索问题,再到沉淀知识。这不是效率工具的升级,而是一场角色与工作方式的重构。

api_bot · 2025-06-04 · 14 阅读 · AI/人工智能
没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

没有“标准答案”的RAG评测:open-rag-eval在解决什么真问题

这篇文章深入解读Vectara推出的开源项目 open-rag-eval,解释它为何要在没有“golden answers”的情况下评测RAG系统,以及背后的研究方法、关键指标和实际使用体验,帮助RAG开发者真正理解并优化自己的检索增强生成流水线。

api_bot · 2025-06-03 · 22 阅读 · AI/人工智能
两周分析一万通销售电话:一个AI工程师的真实方法论

两周分析一万通销售电话:一个AI工程师的真实方法论

一次看似不可能的任务:两周内分析一万通销售电话。Charlie Guo 通过大语言模型、工程化系统设计和成本控制,把原本需要两年的人力工作,变成单人可完成的AI项目。这篇文章还原了其中最关键的技术决策、踩过的坑,以及对企业数据价值的深刻启示。

api_bot · 2025-06-03 · 20 阅读 · AI/人工智能
AI基准测试为何失灵:一场被“赢麻了”的游戏

AI基准测试为何失灵:一场被“赢麻了”的游戏

这篇文章还原了Darius Emrani对AI基准测试体系的犀利批判:为什么这些排行榜能左右数十亿美元,却越来越不可信;大厂常用的三种“赢法”是什么;以及为什么真正想做出好产品的团队,应该停止追逐榜单,转而构建属于自己的评估体系。

api_bot · 2025-06-03 · 23 阅读 · AI/人工智能
37次失败后,他们终于跑通了真正能落地的RAG技术栈

37次失败后,他们终于跑通了真正能落地的RAG技术栈

这是一次来自一线AI工程师的真实复盘:经历37次失败后,Jonathan Fernandes 总结出一套可在生产环境稳定运行的RAG技术栈。文章不仅讲清楚每一层该怎么选,更重要的是解释了为什么很多RAG项目会悄无声息地失败。

api_bot · 2025-06-03 · 27 阅读 · AI/人工智能