文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

Google最强模型不是Gemini：他们为什么押注“你能拥有的AI”

在这场来自 Google DeepMind 的分享里，一个反直觉的结论被反复强调：最强的模型，未必是最适合你的模型。Gemini 很强，但真正改变工程实践的，可能是你能“拿走、跑在自己硬件上、随便改”的 Gemma 4。

api_bot · 2026-06-10 · 9 阅读 · AI/人工智能

把上下文拉到500万Token，Together AI是怎么把H100榨干的

如果我告诉你：在8张H100上训练一个3B模型，光是把模型参数放进去就会直接OOM，你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点，还一路把上下文长度推到了500万Token。这不是炫技，而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 13 阅读 · AI/人工智能

微调 GPU 推理强化学习 AI Agent

做 LLM 的人都会踩的坑：Dat Ngo 说真正难的不是模型，而是这三件事

如果你还在为“该用哪个大模型”纠结，那你已经落后了。Arize AI 的 Dat Ngo 直言：当 LLM 进入生产环境，真正决定成败的不是模型能力，而是你有没有把可观测、评估和实验这三件事做对。这场分享，把行业最容易忽略、却最致命的问题摊在了桌面上。

api_bot · 2026-06-07 · 18 阅读 · AI/人工智能

微调大语言模型提示工程 Token OpenAI

每一次敲键盘都在训练模型：Zed 2如何用真实编辑数据击败大模型

大多数人以为代码补全的未来在更大的模型，但 Zed 团队走了相反的路：用一个小模型，盯住“你下一次会怎么改代码”。更反直觉的是，它的训练数据不是标注出来的，而是你每天真实的编辑行为。Ben Kunkle 用一次演讲，拆开了这个几乎没人公开讲过的生产级训练流程。

api_bot · 2026-05-30 · 27 阅读 · AI/人工智能

微调 AI应用模型训练 AI Agent 代码生成

在 Google DeepMind，AI Agent 最大的敌人不是模型，而是 Token

如果你以为 AI Agent 的核心难题是“模型还不够聪明”，那 Google DeepMind 会当场反驳你。在这场内部工程师的公开分享中，他们反复强调：真正把 Agent 跑到 Google 规模，最大的瓶颈是 Token、成本、配额，以及一整套几乎没人聊过的“代理操作系统”。

api_bot · 2026-05-24 · 46 阅读 · AI/人工智能

微调推理 AI Agent 代码生成提示工程

Google把最强模型开源了，但真正颠覆行业的不是参数规模

在这期 Latent Space 的对话中，DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点：开源模型的未来，不在于更大，而在于“更聪明地变小”。Gemma 4 的发布，只是表面，真正的变化发生在架构、部署方式和研究范式上。

api_bot · 2026-05-24 · 52 阅读 · AI/人工智能

微调 AI Agent 开源模型多模态 Token

Google DeepMind 资深工程师直言：90%的 AI 基础设施都会被模型“吃掉”

当所有人都在卷向量数据库、Agent 框架和微调时，Google DeepMind 的 Paige 却在台上泼了一盆冷水：这些东西，迟早都会被模型本身吞噬。这场长达一小时的分享，不是产品发布，而是一份来自一线的行业预言。

api_bot · 2026-05-23 · 51 阅读 · AI/人工智能

微调开源模型检索增强生成生成式AI 大语言模型

你的 AI Agent 不只会写代码了，它已经能替你训练模型

如果你还以为“训练模型”是工程师的专属技能，那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实：今天的 AI Agent，不只是用模型，而是能自己选模型、配显存、跑任务，甚至替你把模型训好。

api_bot · 2026-05-13 · 75 阅读 · AI/人工智能

微调模型训练开源模型代码生成模型部署

95%的GenAI项目死在上线前：强化学习才是大模型进生产的秘密武器

几乎所有公司都在做 GenAI，但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案：问题不在模型、不在算力，而在你没用强化学习。

api_bot · 2026-05-12 · 66 阅读 · AI/人工智能

微调模型训练强化学习开源模型生成式AI

没有归纳偏置也能赢：Transformer 是如何“吞掉”计算机视觉的

曾经被嘲笑“又慢又没常识”的 Vision Transformer，如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案：不是 ViT 变聪明了，而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。

api_bot · 2026-05-08 · 56 阅读 · AI/人工智能

微调 GPU 神经网络模型部署大语言模型

共 192 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前