文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

在这场来自NVIDIA的分享中,Sylendran Arunagiri提出了一个反直觉但极具实操性的观点:高效、可扩展的AI Agent并不依赖更大的大语言模型,而依赖持续运转的数据飞轮。通过NVIDIA内部NV Info Agent的真实案例,他展示了如何用不到千条高质量数据,让1B、8B小模型逼近70B模型效果。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能
当90%准确率仍不够用:金融领域为何仍需要专用大模型

当90%准确率仍不够用:金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 0 阅读 · AI/人工智能
从提示到多智能体:LinkedIn构建GenAI平台的真实路径

从提示到多智能体:LinkedIn构建GenAI平台的真实路径

LinkedIn并非一开始就要打造宏大的GenAI平台,而是在真实产品压力下,一步步演化出支撑AI Agent的基础设施。本文还原Xiaofeng Wang的分享,讲清楚他们为何自建平台、如何从简单Prompt走向多智能体系统,以及这些选择背后的工程与组织洞见。

api_bot · 2025-04-16 · 0 阅读 · AI/人工智能
Anthropic企业落地实战:从模型能力到可控价值

Anthropic企业落地实战:从模型能力到可控价值

这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。

api_bot · 2025-04-13 · 1 阅读 · AI/人工智能
Manis登场:多智能体协作,AI代理迈入可用时代

Manis登场:多智能体协作,AI代理迈入可用时代

YC最新视频聚焦AI代理平台Manis:它并非更强的单一模型,而是一套精密的多智能体协作系统。文章深入拆解其技术架构、真实能力、成本优势,以及“应用层rapper”模式的机会与隐忧,帮助读者理解AI代理下一阶段真正的竞争焦点。

api_bot · 2025-04-08 · 1 阅读 · AI/人工智能
在OCaml孤岛里造AI:Jane Street的工程化答案

在OCaml孤岛里造AI:Jane Street的工程化答案

当大多数公司直接接入现成AI工具时,Jane Street却选择了一条更难的路:围绕自研语言生态,从数据、训练到编辑器,重新打造AI开发工具链。这篇文章还原了他们如何在“模型不懂OCaml”的现实下,把大语言模型真正变成可用生产力。

api_bot · 2025-03-28 · 1 阅读 · AI/人工智能
真正能落地的AI Agent:一个CTO推翻产品后的9个教训

真正能落地的AI Agent:一个CTO推翻产品后的9个教训

Patrick Dougherty在创业过程中推翻整套产品,转而用AI Agent重构系统。这次分享不是概念宣讲,而是来自真实生产环境的教训:什么才算Agent、为什么“会想”比“知道多”更重要,以及哪些常见做法其实在拖垮Agent表现。

api_bot · 2025-02-22 · 0 阅读 · AI/人工智能