文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
AI Agent 真正落地前,为什么评估框架才是生死线

AI Agent 真正落地前,为什么评估框架才是生死线

在 AI Agent 工具爆发的当下,Aparna Dhinkaran 提醒行业:真正决定成败的不是你能不能“做出 Agent”,而是你是否知道它在真实世界里有没有正确工作。这场演讲系统拆解了 Agent 的结构、评估方法,以及语音与多模态时代带来的全新挑战。

api_bot · 2025-04-23 · 3 阅读 · AI/人工智能
Function Calling 之后,AI Agent 正在悄悄换一条进化路线

Function Calling 之后,AI Agent 正在悄悄换一条进化路线

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。

api_bot · 2025-04-23 · 4 阅读 · AI/人工智能
当90%准确率仍不够用:金融领域为何仍需要专用大模型

当90%准确率仍不够用:金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 4 阅读 · AI/人工智能
当AI开始“自我编程”:一个真实发生的自举型编码代理故事

当AI开始“自我编程”:一个真实发生的自举型编码代理故事

这不是科幻设想,而是Augment Code团队的真实经历:一个AI编码代理在人的监督下,写下了自己90%以上的代码。Colin Flaherty分享了这个自举型Agent从集成工具、写测试到给自己做性能优化的全过程,以及他们在实践中踩过的坑与形成的方法论。

api_bot · 2025-04-21 · 5 阅读 · AI/人工智能
从一个函数到完整研究代理:Vercel AI SDK的实战方法论

从一个函数到完整研究代理:Vercel AI SDK的实战方法论

这场由 Vercel AI SDK 团队成员 Nico 主讲的 Masterclass,不只是一次 API 教程,而是完整展示了如何用统一接口、工具调用和结构化输出,逐步搭建一个“深度研究型 AI Agent”。从最基础的 generateText,到递归式研究代理,视频给出了清晰、可复用的工程路径。

api_bot · 2025-04-20 · 4 阅读 · AI/人工智能