文章

Google最强模型不是Gemini:他们为什么押注“你能拥有的AI”

Google最强模型不是Gemini:他们为什么押注“你能拥有的AI”

在这场来自 Google DeepMind 的分享里,一个反直觉的结论被反复强调:最强的模型,未必是最适合你的模型。Gemini 很强,但真正改变工程实践的,可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。

api_bot · 2026-06-10 · 9 阅读 · AI/人工智能
把上下文拉到500万Token,Together AI是怎么把H100榨干的

把上下文拉到500万Token,Together AI是怎么把H100榨干的

如果我告诉你:在8张H100上训练一个3B模型,光是把模型参数放进去就会直接OOM,你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点,还一路把上下文长度推到了500万Token。这不是炫技,而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 12 阅读 · AI/人工智能
做 LLM 的人都会踩的坑:Dat Ngo 说真正难的不是模型,而是这三件事

做 LLM 的人都会踩的坑:Dat Ngo 说真正难的不是模型,而是这三件事

如果你还在为“该用哪个大模型”纠结,那你已经落后了。Arize AI 的 Dat Ngo 直言:当 LLM 进入生产环境,真正决定成败的不是模型能力,而是你有没有把可观测、评估和实验这三件事做对。这场分享,把行业最容易忽略、却最致命的问题摊在了桌面上。

api_bot · 2026-06-07 · 18 阅读 · AI/人工智能
每一次敲键盘都在训练模型:Zed 2如何用真实编辑数据击败大模型

每一次敲键盘都在训练模型:Zed 2如何用真实编辑数据击败大模型

大多数人以为代码补全的未来在更大的模型,但 Zed 团队走了相反的路:用一个小模型,盯住“你下一次会怎么改代码”。更反直觉的是,它的训练数据不是标注出来的,而是你每天真实的编辑行为。Ben Kunkle 用一次演讲,拆开了这个几乎没人公开讲过的生产级训练流程。

api_bot · 2026-05-30 · 27 阅读 · AI/人工智能
在 Google DeepMind,AI Agent 最大的敌人不是模型,而是 Token

在 Google DeepMind,AI Agent 最大的敌人不是模型,而是 Token

如果你以为 AI Agent 的核心难题是“模型还不够聪明”,那 Google DeepMind 会当场反驳你。在这场内部工程师的公开分享中,他们反复强调:真正把 Agent 跑到 Google 规模,最大的瓶颈是 Token、成本、配额,以及一整套几乎没人聊过的“代理操作系统”。

api_bot · 2026-05-24 · 46 阅读 · AI/人工智能
Google把最强模型开源了,但真正颠覆行业的不是参数规模

Google把最强模型开源了,但真正颠覆行业的不是参数规模

在这期 Latent Space 的对话中,DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点:开源模型的未来,不在于更大,而在于“更聪明地变小”。Gemma 4 的发布,只是表面,真正的变化发生在架构、部署方式和研究范式上。

api_bot · 2026-05-24 · 51 阅读 · AI/人工智能
Google DeepMind 资深工程师直言:90%的 AI 基础设施都会被模型“吃掉”

Google DeepMind 资深工程师直言:90%的 AI 基础设施都会被模型“吃掉”

当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。

api_bot · 2026-05-23 · 50 阅读 · AI/人工智能
你的 AI Agent 不只会写代码了,它已经能替你训练模型

你的 AI Agent 不只会写代码了,它已经能替你训练模型

如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。

api_bot · 2026-05-13 · 75 阅读 · AI/人工智能
95%的GenAI项目死在上线前:强化学习才是大模型进生产的秘密武器

95%的GenAI项目死在上线前:强化学习才是大模型进生产的秘密武器

几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。

api_bot · 2026-05-12 · 65 阅读 · AI/人工智能
没有归纳偏置也能赢:Transformer 是如何“吞掉”计算机视觉的

没有归纳偏置也能赢:Transformer 是如何“吞掉”计算机视觉的

曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。

api_bot · 2026-05-08 · 56 阅读 · AI/人工智能