百度AI实验室负责人谈语音识别:从口音到99.9%的那一步
这次访谈中,百度硅谷AI实验室负责人分享了百度如何从搜索公司转型为AI公司,以及语音识别技术从研究走向产品的真实路径。内容涵盖数据规模、口音难题、研究转化机制,以及他对“语音是否已被解决”的冷静判断。
这次访谈中,百度硅谷AI实验室负责人分享了百度如何从搜索公司转型为AI公司,以及语音识别技术从研究走向产品的真实路径。内容涵盖数据规模、口音难题、研究转化机制,以及他对“语音是否已被解决”的冷静判断。
这是一场从电影聊到人工智能根本问题的对话。作为《机械姬》的科学顾问,Murray Shanahan没有谈炫技式的AI未来,而是反复追问:什么才算真正的智能?哪些问题几十年过去仍然没有答案?
两位曾站在增长浪潮中心的操盘者,回顾从Facebook平台红利到双边市场扩张的真实经验,讲述增长团队角色如何演变,以及今天做增长真正该坚持的事情。
这是一场不谈套路的创业回顾。Hosain Rahman以自身经历,讲述了如何在技术理想、资金压力和市场现实之间反复摇摆,又如何一次次“回到客户问题”,才让事情重新走上正轨。
这场来自LinkedIn AI的分享,讲述了他们如何用一个大语言模型统一推荐、排序与个性化任务,并一步步把它真正部署到线上。它不仅回答了“LLM能不能做推荐”,更详细拆解了在延迟、成本和效果之间反复拉扯的工程现实。
Intercom在短短100天内上线了企业级语音AI代理Finn Voice。本文还原这次产品交付背后的关键决策:为什么语音是下一战场、他们如何克制地选择首个用例、怎样把语音AI嵌入真实客服流程,以及评估和定价背后的思考。
这是一场来自 Replicate 的自我反省式演讲。Zeke Sikelianos 以 Andrej Karpathy 的一次“随手黑客松”项目为线索,讲述了一个残酷但正在发生的转变:AI 产品的第一用户,已经不再是人,而是大语言模型本身。
Charles Frye 在这次演讲中给 AI 工程师泼了一盆冷水:只会调用模型 API 已经不够了。随着推理成本、延迟和规模问题暴露,理解 GPU 的设计哲学——带宽、并行性和张量计算——正成为构建下一代 AI 应用的基础能力。
这场演讲从一个微妙却普遍的现象出发:为什么几乎所有AI产品都在变成“聊天框+模型下拉菜单”?Maximillian Piras提出“苦涩布局”这一概念,借助模型选择器、模式切换和架构理论,揭示了当下AI UX设计被技术进步反向塑形的深层原因,以及设计师如何走向更“甜”的未来。
Steve Ruiz 讲述了 tldraw 从数字墨水库到 AI 画布计算机的演化历程。这不仅是一个白板工具的升级故事,更是一次关于“可编程画布 + 多模态 AI”如何重塑创作方式的探索。