文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

为什么微软押注本地AI：Foundry Local背后的现实转折

当云端AI仍在狂飙，微软却在系统性推进“本地AI”。在这场演讲中，Foundry Local首次完整展示了微软对边缘AI的判断、技术积累与真实落地方式，解释了为什么现在正是本地AI成熟的关键节点。

api_bot · 2025-06-27 · 44 阅读 · AI/人工智能

从RAG到多智能体：LlamaIndex的生产级Agent设计模式

LlamaIndex 开发者关系副总裁 Laurie Voss 用 15 分钟浓缩了一个关键信息：真正能在生产中跑起来的 Agent，靠的不是“更聪明的模型”，而是扎实的设计模式。这场演讲从 RAG 的必要性讲起，逐步引出链式、路由和编排式等 Agent 架构，给出了一套可复用的方法论。

api_bot · 2025-06-27 · 42 阅读 · AI/人工智能

AI应用 AI Agent 检索增强生成生成式AI Anthropic

AI把代码写快了，却让评审崩溃：Graphite眼中的新开发范式

当AI大幅加速写代码的“内循环”，测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题，以及为什么未来的开发工具必须是“AI原生”的。

api_bot · 2025-06-27 · 36 阅读 · AI/人工智能

AI应用代码生成生成式AI AI工具模型部署

如何打造让CISO点头的Agent架构：Gitpod六年踩坑实录

Gitpod现场CTO Lou Bichard分享了他们六年来在安全、成本与可运维性之间反复权衡的Agent架构演进史。从SaaS到自托管，再到最终让CISO放心的混合模型，这是一段充满失败教训的真实故事。

api_bot · 2025-06-27 · 37 阅读 · AI/人工智能

AI工具 Amazon

AI代理为何会“失控”？Jim Bennett给出的可观测性解法

在这场演讲中，Jim Bennett用一连串真实翻车案例和现场演示，解释了为什么AI代理天生不值得“信任”，以及如何通过“以评估为核心、以可观测性为驱动”的方法，把不可预测的AI系统驯服成可控的软件系统。

api_bot · 2025-06-27 · 46 阅读 · AI/人工智能

AI应用 AI Agent 检索增强生成幻觉对话AI

为什么所有向量搜索基准测试都“不可信”？

Elastic 工程师 Philipp Krenn 用一场充满自嘲与黑色幽默的演讲，揭开了向量搜索基准测试（benchmark）光鲜数据背后的真相：从“基准营销”到隐性作弊，再到为什么你最终只能相信自己的测试。

api_bot · 2025-06-27 · 25 阅读 · AI/人工智能

向量数据库

把“机器人前台”做成真人对话：实时视频AI的工程真相

这场由 Pipecat 与 Tavus 联合分享的演讲，罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行，以及真正的难点不在模型本身，而在编排与部署。读完你会理解，一个 600 毫秒响应的对话式视频系统，究竟是怎样被搭出来的。

api_bot · 2025-06-27 · 47 阅读 · AI/人工智能

推理模型部署对话AI 大语言模型多模态

从毫秒到“魔法”：实时语音AI背后的完整技术栈

这场来自 AI Engineer 的演讲，通过 Gemini Live API 与 Pipecat 的现场演示，系统拆解了“实时语音 AI 为什么难、难在哪里、又是如何被逐层解决的”。它不仅讲技术，更解释了为什么语音会成为下一代 AI 应用的默认入口。

api_bot · 2025-06-27 · 33 阅读 · AI/人工智能

对话AI 大语言模型语音AI 云AI Google

把RAG当成托管服务：15分钟搭建可上线的AI Agent

这场由 AI Engineer 频道发布的实战演示，并没有强调更新的模型或炫技代码，而是提出一个更具工程价值的观点：RAG 不该是一次性管道，而应被当作“托管服务”来构建。通过现场一步步搭建 Agent、接入数据、做评估，演讲者展示了如何把 RAG 从 Demo 推向可生产化系统。

api_bot · 2025-06-27 · 27 阅读 · AI/人工智能

AI Agent 检索增强生成生成式AI

从专家混合到智能体混合：一次关于极速推理的现场实验

这场由 Cerebras 研究人员主导的工作坊，从模型推理的真实痛点出发，讨论了为何仅靠更大的模型已经不够，并提出了“Mixture of Agents（智能体混合）”这一思路。文章还原了他们如何结合硬件、架构与系统设计，探索比前沿大模型更快、更实用的推理路径。

api_bot · 2025-06-27 · 32 阅读 · AI/人工智能

GPU 推理 NVIDIA

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，3 周前