文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
Function Calling 之后,AI Agent 正在悄悄换一条进化路线

Function Calling 之后,AI Agent 正在悄悄换一条进化路线

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。

api_bot · 2025-04-23 · 4 阅读 · AI/人工智能
当90%准确率仍不够用:金融领域为何仍需要专用大模型

当90%准确率仍不够用:金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 4 阅读 · AI/人工智能
从一个函数到完整研究代理:Vercel AI SDK的实战方法论

从一个函数到完整研究代理:Vercel AI SDK的实战方法论

这场由 Vercel AI SDK 团队成员 Nico 主讲的 Masterclass,不只是一次 API 教程,而是完整展示了如何用统一接口、工具调用和结构化输出,逐步搭建一个“深度研究型 AI Agent”。从最基础的 generateText,到递归式研究代理,视频给出了清晰、可复用的工程路径。

api_bot · 2025-04-20 · 4 阅读 · AI/人工智能
当AI Agent进入企业,安全不是加分项而是生死线

当AI Agent进入企业,安全不是加分项而是生死线

Apache Ranger 创始成员 Don Bosco Durai 结合自身开源与创业经历,系统拆解了 AI Agent 在企业落地时被严重低估的安全与合规问题,并给出一套可执行的三层方法论:从安全评估、零信任执行到持续可观测性,帮助团队真正把 Agent 放进生产环境。

api_bot · 2025-04-19 · 4 阅读 · AI/人工智能
为什么AI Agent总翻车?一位工程师的冷静诊断

为什么AI Agent总翻车?一位工程师的冷静诊断

在AI Agent被热烈追捧的当下,Sayash Kapoor给出了一次“泼冷水式”的演讲:Agent并没有我们想象中那么可靠。通过法律、科研和产品落地的真实失败案例,他指出问题不在模型能力,而在评估方法与可靠性工程。

api_bot · 2025-04-17 · 4 阅读 · AI/人工智能
从提示到多智能体:LinkedIn构建GenAI平台的真实路径

从提示到多智能体:LinkedIn构建GenAI平台的真实路径

LinkedIn并非一开始就要打造宏大的GenAI平台,而是在真实产品压力下,一步步演化出支撑AI Agent的基础设施。本文还原Xiaofeng Wang的分享,讲清楚他们为何自建平台、如何从简单Prompt走向多智能体系统,以及这些选择背后的工程与组织洞见。

api_bot · 2025-04-16 · 4 阅读 · AI/人工智能
Anthropic企业落地实战:从模型能力到可控价值

Anthropic企业落地实战:从模型能力到可控价值

这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。

api_bot · 2025-04-13 · 4 阅读 · AI/人工智能
RAG进生产:创始人总结的10个企业级教训

RAG进生产:创始人总结的10个企业级教训

RAG(检索增强生成)的提出者Douwe Kiela,用真实的企业落地经验解释了一个残酷现实:AI投入巨大,但真正产生价值的公司不到四分之一。这篇文章提炼了他在生产环境中踩过的坑、反直觉的认知,以及为什么“系统”和“上下文”才是AI ROI的决定因素。

api_bot · 2025-04-10 · 3 阅读 · AI/人工智能