文章

全部 AI Agent Y Combinator AI应用 大语言模型 Google 推理 创业 提示工程 代码生成 生成式AI 对话AI 模型训练 模型部署 检索增强生成 AI工具
从15分钟超时到Agent Native Cloud:Rick Blalock的代理混乱治理之道

从15分钟超时到Agent Native Cloud:Rick Blalock的代理混乱治理之道

Rick Blalock在一次真实而略显混乱的现场演示中,讲清了当下AI Agent最被低估的难题:部署与运行。他用学生项目和自身踩坑经历,解释为什么Serverless并不适合长跑型Agent,以及为什么“Agent Native”的基础设施正在成为新一代云的分水岭。

api_bot · 2025-07-01 · 1 阅读 · AI/人工智能
毫秒级语音AI如何落地:Cartesia与AWS的实时推理新范式

毫秒级语音AI如何落地:Cartesia与AWS的实时推理新范式

这场对话罕见地从第一性原理出发,拆解了“语音AI为什么难以规模化”的核心原因。Cartesia联合创始人Arjun Desai与AWS的Rohit Talluri分享了他们在实时语音、低延迟推理和新模型架构上的关键判断,揭示了企业级语音AI真正的技术门槛。

api_bot · 2025-06-27 · 1 阅读 · AI/人工智能
把生成式AI嵌入SDLC:Amazon Q如何重塑开发者工作流

把生成式AI嵌入SDLC:Amazon Q如何重塑开发者工作流

这支演示视频通过一个“从零构建2048游戏”的真实案例,完整展示了Amazon Q Developer如何贯穿软件开发生命周期。从需求规划、编码、测试、文档、GitHub协作到云端部署与运维,演讲者给出了一个清晰信号:生成式AI不再只是写代码工具,而是开发者的“全流程助手”。

api_bot · 2025-06-10 · 0 阅读 · AI/人工智能
别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

别再迷信更大的模型:真正让AI Agent变强的是数据飞轮

在这场来自NVIDIA的分享中,Sylendran Arunagiri提出了一个反直觉但极具实操性的观点:高效、可扩展的AI Agent并不依赖更大的大语言模型,而依赖持续运转的数据飞轮。通过NVIDIA内部NV Info Agent的真实案例,他展示了如何用不到千条高质量数据,让1B、8B小模型逼近70B模型效果。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能
NVIDIA如何终结“尴尬转写”:企业级语音AI的真实打法

NVIDIA如何终结“尴尬转写”:企业级语音AI的真实打法

这场来自 NVIDIA Speech AI 团队的分享,揭示了一个常被忽视的事实:语音识别体验的差距,不在于单一模型有多聪明,而在于是否能围绕真实部署场景进行系统化设计。从流式ASR到多说话人识别,从模型结构到部署形态,NVIDIA给出了他们“终结尴尬转写”的方法论。

api_bot · 2025-06-03 · 1 阅读 · AI/人工智能
Anthropic企业落地实战:从模型能力到可控价值

Anthropic企业落地实战:从模型能力到可控价值

这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。

api_bot · 2025-04-13 · 1 阅读 · AI/人工智能
为什么真正有用的个人AI代理,必须本地、私有、可控

为什么真正有用的个人AI代理,必须本地、私有、可控

PyTorch 联合创始人 Soumith Chintala 从亲身使用 AI 的挫折与收获出发,提出一个与主流云端 Agent 不同的判断:真正能托付个人生活的 AI,必须运行在本地、完全私有。本文还原他的关键故事、技术现实与尚未解决的挑战。

api_bot · 2025-04-06 · 0 阅读 · AI/人工智能