从零搭建检索系统:一堂打破RAG迷思的工程课
这是一堂从最基础的关键词搜索讲起,逐步走向向量搜索与混合检索的实战课程。Elastic 的 Philipp Krenn 用大量现场演示告诉你:RAG 的成败不在模型,而在你是否真正理解“检索”这件事。
这是一堂从最基础的关键词搜索讲起,逐步走向向量搜索与混合检索的实战课程。Elastic 的 Philipp Krenn 用大量现场演示告诉你:RAG 的成败不在模型,而在你是否真正理解“检索”这件事。
Retool 产品负责人 Donald Hruska 直言:企业在 AI 上已经投入了半万亿美元,却大多停留在聊天机器人和代码补全阶段。真正的拐点,是“能接入生产系统、带护栏的 AI Agents”。这场演讲系统讲清了 agents 为什么今年才成立、难点在哪,以及企业该如何在“自建还是买平台”之间做出理性选择。
这是一场专为Web开发者准备的演讲:Ishan Anand用大约600行原生JavaScript,从零跑起一个GPT‑2级别的语言模型。文章还原他在现场的讲解路径,带你理解Token、Embedding、MLP和Language Head如何串起来,以及为什么ChatGPT并不“神秘”。
ArtificialAnalysis 联合创始人 George Cameron 用真实基准数据揭示:AI 不只有“最强智能”这一条前沿。推理模型的高代价、开源权重的快速逼近、以及成本与速度的数量级差异,正在重塑我们构建 AI 应用的方式。
这场演讲不讲炫技,而是直指语音模型落地生产时最容易被忽视的瓶颈:延迟并不只在模型里,GPU也不是唯一答案。Philip Kiely 从架构、指标到客户端代码,拆解了如何让语音 AI 真正“听起来快、用得起、撑得住”。
Rick Blalock在一次真实而略显混乱的现场演示中,讲清了当下AI Agent最被低估的难题:部署与运行。他用学生项目和自身踩坑经历,解释为什么Serverless并不适合长跑型Agent,以及为什么“Agent Native”的基础设施正在成为新一代云的分水岭。
这场来自 AI Engineer 的分享,直面一个正在失控的问题:当 AI Agent 不再只是聊天,而是代表用户调用 API、操作系统、执行交易,安全体系还能沿用老一套吗?Bobby 和 Cam 用真实架构、失败隐患和现场 Demo,给出了基于开放标准的答案。
这是一场来自OpenAI开发者体验团队的一线分享。Dominik Kundel系统讲解了语音Agent为何重要、架构如何选择,以及实时语音Agent在延迟、工具调用和安全上的真实挑战,展示了OpenAI最新Agents SDK与实时API背后的设计取舍。
Charles Frye 用现场基准测试回答了一个被反复讨论却少有数据支撑的问题:今天的 LLM 推理引擎到底有多快?这场分享不讲抽象趋势,而是用真实模型、真实接口、真实延迟,说明为什么“自托管”在 2025 年终于变得合理。
这场由 Pipecat 与 Tavus 联合分享的演讲,罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行,以及真正的难点不在模型本身,而在编排与部署。读完你会理解,一个 600 毫秒响应的对话式视频系统,究竟是怎样被搭出来的。