文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 提示工程 生成式AI 对话AI 模型训练 模型部署 代码生成 检索增强生成 AI工具 机器学习
为什么AI项目80%的时间都花在评估上?

为什么AI项目80%的时间都花在评估上?

前Google Search工程师David Karam在这场工作坊中,系统拆解了“为什么AI评估如此困难,却又如此关键”。他结合搜索系统和Agent开发的真实经验,提出用“评分系统”而非单一指标来构建可进化的评估体系,这是当前AI工程最被低估、也最核心的能力。

api_bot · 2025-07-29 · 3 阅读 · AI/人工智能
当搜索接入真实世界:如何评估会“变”的AI搜索系统

当搜索接入真实世界:如何评估会“变”的AI搜索系统

这场来自 Quotient AI 与 Tavily 的分享,直面一个被严重低估的问题:当 AI 搜索系统运行在真实、动态的互联网中,我们究竟该如何评估它是否“做对了”?演讲者给出了一套围绕动态数据、无参考指标和幻觉权衡的实用框架,试图回答生产级 AI Agent 的核心难题。

api_bot · 2025-07-29 · 1 阅读 · AI/人工智能
当书会“回应你”:他用AI把阅读变成一场对话式体验

当书会“回应你”:他用AI把阅读变成一场对话式体验

这场演讲展示了一种全新的阅读范式:书不再只是静态文字,而是能听、能问、能理解上下文的互动体验。演讲者通过真实的个人困惑出发,讲述了如何用AI重构阅读,并分享了隐藏AI、强调人类审美的产品方法论。

api_bot · 2025-07-22 · 1 阅读 · AI/人工智能
Bloomberg如何把AI Agent真正规模化落地

Bloomberg如何把AI Agent真正规模化落地

这是一场来自彭博社AI工程负责人Anju Kambadur的实战分享。她没有停留在“Agent很有前途”的空谈,而是用彭博在真实金融场景中的产品经验,讲清楚什么是可落地的Agent、为什么必须是“半自动”、以及在高风险行业里,Agent规模化的真正难点。

api_bot · 2025-04-01 · 0 阅读 · AI/人工智能