文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成对话AI Sam Altman 多模态开源模型提示工程

把上下文拉到500万Token，Together AI是怎么把H100榨干的

如果我告诉你：在8张H100上训练一个3B模型，光是把模型参数放进去就会直接OOM，你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点，还一路把上下文长度推到了500万Token。这不是炫技，而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 13 阅读 · AI/人工智能

微调 GPU 推理强化学习 AI Agent

代码模型快了20倍，但Sarah Chieng警告：开发者必须慢下来

当代码生成从每秒50个Token飙到1200个，真正的瓶颈不再是模型，而是人。Cerebras的Sarah Chieng在这场演讲中抛出一个反直觉观点：模型越快，开发者越要“慢”。否则，我们只是在用20倍的速度制造技术债。

api_bot · 2026-05-22 · 44 阅读 · AI/人工智能

AI应用模型训练 AI Agent 代码生成上下文窗口

他发现推理才是AI的真瓶颈，于是干了一件没人愿意干的事

我们都在追更大的模型、更快的训练，却忽略了一个更“脏更累”的问题：模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑，揭开了小模型推理基础设施的巨大空白。

api_bot · 2026-05-05 · 65 阅读 · AI/人工智能

微调 GPU 推理模型训练 AI Agent

真正限制大模型的不是参数，而是这几道被忽视的“数学与物理墙”

当所有人都在盯着参数规模时，这场对话却反其道而行：LLM 的成败，早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账，一次性摊在桌面上。

api_bot · 2026-04-29 · 93 阅读 · AI/人工智能

GPU 推理 GPT-4 注意力机制 AI推理

Gemma 4 刚开源就进前六，DeepMind 把小模型的天花板掀了

Google DeepMind 悄悄干了一件“反直觉”的事：没有堆参数、没有锁生态，却用 Gemma 4 把开源模型直接送进榜单前六。从 31B 多模态到能跑在设备端的小模型，这次更新释放了一个强烈信号——下一轮 AI 竞争，不再只属于巨无霸模型。

api_bot · 2026-04-27 · 62 阅读 · AI/人工智能

推理开源模型代码生成多模态计算机视觉

OpenAI工程师内部方法论：不是造更强Agent，而是造好“缰绳”

当所有人都在比拼谁的 Agent 更聪明时，OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点：真正的工程难题不在模型，而在“Harness（缰绳）”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向，Agent 负责执行。

api_bot · 2026-04-17 · 130 阅读 · AI/人工智能

AI Agent 提示工程 Token OpenAI 注意力机制

1美元的AI护栏：微调ModernBERT，竟能挡住最危险的LLM攻击

很多人以为AI安全只能靠更大的模型、更贵的系统。但这支视频抛出一个反直觉的结论：用一个成本低到“1美元级别”的微调ModernBERT，就能构建有效的LLM安全护栏，而且不是纸上谈兵，而是真正跑过攻击向量的实战方案。

api_bot · 2026-04-16 · 69 阅读 · AI/人工智能

GPU 推理模型训练 AI安全大语言模型

SaaS末日并未到来：AI狂飙下真正危险的是没人懂的代码

市场在喊“SaaS已死”，工程师在疯狂写AI代码，但真正让这期播客炸裂的，是一个反直觉判断：不是软件被取代，而是“没人真正理解的软件”正在变成系统性风险。这里讲清楚哪些是泡沫，哪些才是AI时代的真机会。

api_bot · 2026-02-19 · 104 阅读 · AI/人工智能

AI应用 GPU AI Agent 代码生成 Token

在新加坡“闻到AGI的味道”：DeepMind核心研究员谈IMO金牌与RL转向

如果你还以为AGI只是个营销词，那这期对谈会让你不安。Yi Tay 亲口承认：把“AGI”写进团队名字并不是玩笑；而在IMO金牌、On-Policy RL、AI编程全面可用的背后，一条新的技术主线已经浮出水面。

api_bot · 2026-01-23 · 84 阅读 · AI/人工智能

模型训练机器学习强化学习通用人工智能代码生成

Sora 2点燃“脑腐”叛乱：当生成视频开始反噬注意力

OpenAI发布Sora 2后，短视频世界出现了意想不到的反应：不是精致商业内容，而是一场由“纯想象”驱动的创作狂欢。本文还原The AI Daily Brief视频中的关键故事与判断，解析Sora 2的技术特征、注意力机制争议，以及它为何可能改变我们与内容平台的关系。

api_bot · 2025-10-02 · 74 阅读 · AI/人工智能

OpenAI Sora 注意力机制

共 35 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

5 月前