为什么语音AI总爱打断你:一次关于“轮次”的技术反思
这场演讲聚焦一个几乎所有语音AI用户都遇到过的问题:系统为什么总是在你还没说完时插话。演讲者从“轮次控制”这一被低估的核心难题出发,拆解了语音活动检测、语义预测到最终决策的整条技术链路,解释为什么这不是一个靠调参就能解决的问题。
这场演讲聚焦一个几乎所有语音AI用户都遇到过的问题:系统为什么总是在你还没说完时插话。演讲者从“轮次控制”这一被低估的核心难题出发,拆解了语音活动检测、语义预测到最终决策的整条技术链路,解释为什么这不是一个靠调参就能解决的问题。
这是一场关于实时语音AI的“反直觉”分享:模型能力并不是决定体验的关键,延迟才是。来自 OpenAI 和 Daily 的工程师,用一次紧张又好笑的现场 Demo,拆解了语音 AI 成败背后的真实技术逻辑。
语音智能体迟迟未能大规模落地,并非模型不够强,而是缺乏系统性的评测方法。Coval 创始人 Brooke Hopkins 结合自己在自动驾驶评测体系中的经验,提出用大规模仿真、持续评测和概率化指标,解决语音代理“不可靠、不敢放权”的核心难题。
这是一场面向开发者的实战工作坊,演讲者以构建对话式AI代理为主线,拆解了从语音识别、语义理解到语音合成的完整链路,并通过现场演示和问答,分享了延迟、配置灵活性与滥用风险等一线经验。
这场演讲来自 Daily 联合创始人 Quinn,对 Pipecat 这一开源语音 Agent 框架的来龙去脉做了一次“工程师视角”的速览。它不仅讲清了语音 AI 真正难的地方在哪,也解释了为什么企业在语音 Agent 上,越来越重视开源、可控和中立的技术栈。
本文讲述了Model ML两位连续创业者如何将AI Agent技术带入华尔街,改变金融行业的日常工作方式。通过真实创业故事与技术细节,揭示了AI在金融服务中的落地、团队文化、行业转型,以及创业者的独特洞见。
随着AI从“写代码”进化为“执行代码”,安全问题被推到台前。OpenAI安全工程师Fouad Matin结合Codex与代码执行智能体的实践,讲述了为何所有AI都会变成代码执行者,以及如何通过沙箱、权限与人类审查,避免这股力量反噬。
YC 创业公司 Casco 的 CEO Renee Brandel 现场拆解了他们如何“黑进”一批 AI Agent。与其说是炫技,这更像一次对新一代智能应用安全底座的集体体检,揭示了当下 Agent 系统中最容易被忽视、却最致命的设计问题。
这是一次来自OAuth老兵的现场反思:当AI代理被连接到越来越多真实系统时,传统“给权限就完事”的做法正在失效。Jared Hanson结合自己在Passport.js、身份基础设施和最新创业Keycard中的经验,解释为什么OAuth依然重要,但必须被重新使用。
Arcjet 创始人 David Mytton 结合多年一线经验,讲述 AI 时代机器人流量为何变得更危险,以及开发者该如何从“识别好坏机器人”转向“构建多信号防御体系”。