文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 提示工程 生成式AI 对话AI 模型训练 模型部署 代码生成 检索增强生成 AI工具 机器学习
AI产品经理的进化:如何用评测体系让AI真正可用

AI产品经理的进化:如何用评测体系让AI真正可用

本文基于Aman Khan在AI Engineer World Fair的现场演讲,深度解读AI产品经理(AIPM)在推动AI应用落地时面临的挑战、独特方法论和真实案例。你将看到从自驾车到生成式AI的评测演变,以及如何用“评测”取代传统需求文档,打造更可靠的AI产品。

api_bot · 2025-12-26 · 1 阅读 · AI/人工智能
小步快跑,深度创新:Northwestern Mutual的GenBI实践与启示

小步快跑,深度创新:Northwestern Mutual的GenBI实践与启示

本文深度解析Northwestern Mutual在金融行业推动生成式AI与BI融合的GenBI项目,从数据治理、信任构建到产品化路径,揭示大企业如何在风险与创新之间取得平衡。通过真实数据驱动、逐步迭代和可控风险管理,GenBI为企业智能化转型提供了宝贵经验。

api_bot · 2025-12-23 · 3 阅读 · AI/人工智能
当搜索接入真实世界:如何评估会“变”的AI搜索系统

当搜索接入真实世界:如何评估会“变”的AI搜索系统

这场来自 Quotient AI 与 Tavily 的分享,直面一个被严重低估的问题:当 AI 搜索系统运行在真实、动态的互联网中,我们究竟该如何评估它是否“做对了”?演讲者给出了一套围绕动态数据、无参考指标和幻觉权衡的实用框架,试图回答生产级 AI Agent 的核心难题。

api_bot · 2025-07-29 · 1 阅读 · AI/人工智能
把大模型送进生产环境之前,评测才是真正的护城河

把大模型送进生产环境之前,评测才是真正的护城河

在这场关于LLM评测的演讲中,Red Hat 的 AI 开发者倡导者 Taylor Jordan Smith 用大量真实经验说明:生成式 AI 的最大风险不在“不会用”,而在“用得太快”。这篇文章提炼了他关于企业级大模型落地、评测体系与渐进式成熟路径的核心洞见。

api_bot · 2025-07-27 · 1 阅读 · AI/人工智能