法律AI的RAG如何落地到千万文档规模?Harvey的真实经验
一场来自Harvey与LanceDB的联合分享,首次系统讲清楚企业级RAG在法律场景下面临的真实难题:复杂查询、超大规模数据、严格安全要求,以及为什么“评估”比算法本身更重要。
一场来自Harvey与LanceDB的联合分享,首次系统讲清楚企业级RAG在法律场景下面临的真实难题:复杂查询、超大规模数据、严格安全要求,以及为什么“评估”比算法本身更重要。
本文深度解读Anthropic联合创始人Jared Kaplan在Y Combinator的演讲,揭示AI规模化背后的科学洞见、技术趋势,以及他从理论物理转向AI的个人故事。你将看到AI训练的核心机制、行业变革的独特视角,以及未来人类与AI协作的可能场景。
这场演讲围绕一个核心问题展开:为什么“通用机器人”在今天才变得可行?两位来自Physical Intelligence的研究者,从视觉-语言-动作模型(VLA)的技术突破、数据引擎的构建方式,到真实家庭场景中的机器人演示,给出了一个比“算力更强了”更具体、更残酷也更乐观的答案。
这场来自 Waymo 的技术分享,讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”,而是如何用多模态、可解释的方式,解决规模化中最棘手的长尾安全问题。
这场演讲不是炫技,而是一位一线构建者对企业级生成式AI落地的复盘。从多模态搜索的现场演示,到AWS上的分层架构,再到ROI与个性化的取舍,Randall Hunt分享了把POC真正推向生产环境时,最容易被忽视却代价高昂的经验。
这场演讲展示了一种全新的阅读范式:书不再只是静态文字,而是能听、能问、能理解上下文的互动体验。演讲者通过真实的个人困惑出发,讲述了如何用AI重构阅读,并分享了隐藏AI、强调人类审美的产品方法论。
本文带你走进Chelsea Finn在Y Combinator分享的机器人学习前沿实践,从失败到突破,揭示通用机器人如何通过大规模数据、预训练与微调,逐步迈向“能做任何事”的物理智能。你将看到真实的技术难题、创业故事,以及对未来机器人行业的独到预判。
在这场Recsys主题演讲中,Eugene Yan没有讨论“要不要用大模型”,而是回答了“该怎么用”。他用一系列真实案例,提出了三条正在落地的路径:语义化ID、基于大模型的数据增强,以及统一模型,展示了推荐与搜索系统在LLM时代的真实进化方式。
Together AI 开发者关系负责人 Hassan El Mghari,用自己四年、每月一个项目的实战经历,拆解了如何用开源模型快速构建 AI 应用,并让其中一部分真正触达百万用户。这不仅是技术分享,更是一套可复制的构建与试错方法论。
这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟,讲清了Gemini过去一年真正的转折点:为什么2.5 Pro意义重大,DeepMind为何从“纯研究”转向“研究+交付”,以及他们眼中多模态、Agent和“无限上下文”的下一站。