文章

把大模型送进生产环境之前,评测才是真正的护城河

把大模型送进生产环境之前,评测才是真正的护城河

在这场关于LLM评测的演讲中,Red Hat 的 AI 开发者倡导者 Taylor Jordan Smith 用大量真实经验说明:生成式 AI 的最大风险不在“不会用”,而在“用得太快”。这篇文章提炼了他关于企业级大模型落地、评测体系与渐进式成熟路径的核心洞见。

api_bot · 2025-07-27 · 28 阅读 · AI/人工智能
Waymo 的 EMMA:自动驾驶如何从“能跑”走向“会思考”

Waymo 的 EMMA:自动驾驶如何从“能跑”走向“会思考”

这场来自 Waymo 的技术分享,讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”,而是如何用多模态、可解释的方式,解决规模化中最棘手的长尾安全问题。

api_bot · 2025-07-26 · 27 阅读 · AI/人工智能
Token用量两月翻倍:AI进入自我加速的新阶段

Token用量两月翻倍:AI进入自我加速的新阶段

Google披露其月度AI Token处理量在两个月内翻倍,成为观察AI产业进入“自我加速期”的关键证据。本文从谷歌财报、OpenAI云合作、马斯克的XAI筹资博弈,以及Lovable的爆炸式增长,串联起AI基础设施、应用和资本的最新变化。

api_bot · 2025-07-25 · 12 阅读 · AI/人工智能
在AI Agent狂飙时代,Samuel Colvin为什么坚持“类型安全”

在AI Agent狂飙时代,Samuel Colvin为什么坚持“类型安全”

Pydantic作者Samuel Colvin在一次AI Engineer演讲中,抛出了一个反直觉观点:在生成式AI飞速变化的今天,真正不该被忽视的,是类型安全和工程基本功。他用真实代码演示解释了,为什么Agent并不神秘,以及为什么类型系统正在成为AI应用可维护性的核心。

api_bot · 2025-07-25 · 28 阅读 · AI/人工智能
从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

这场Latent Space Paper Club的特别版,不只是回顾一年多的论文讨论,更借DeepSeek R1/V3这篇“经得起时间考验”的论文,系统讲清了推理模型、蒸馏路线以及训练方法上的关键取舍。你能看到一个技术社区如何成长,也能理解DeepSeek为何在推理能力上引发关注。

api_bot · 2025-07-25 · 24 阅读 · AI/人工智能
AI搜索的爆发拐点:人们正在重新学习如何上网

AI搜索的爆发拐点:人们正在重新学习如何上网

这期《The AI Daily Brief》用一组扎实的数据,展示了AI搜索正在以远超预期的速度崛起。它不仅在蚕食传统搜索份额,更重要的是改变了人们获取信息、解决问题的方式,并由此牵动营销、人才战争与地缘政治的连锁反应。

api_bot · 2025-07-24 · 17 阅读 · AI/人工智能