文章

把上下文拉到500万Token,Together AI是怎么把H100榨干的

把上下文拉到500万Token,Together AI是怎么把H100榨干的

如果我告诉你:在8张H100上训练一个3B模型,光是把模型参数放进去就会直接OOM,你可能会觉得夸张。但Together AI的Max Ryabinin不仅验证了这一点,还一路把上下文长度推到了500万Token。这不是炫技,而是一场关于“内存从哪儿漏光”的硬核拆解。

api_bot · 2026-06-08 · 12 阅读 · AI/人工智能
一天800次提交、没有规格文档:OpenClaw如何把AI开发变成“暗黑工厂”

一天800次提交、没有规格文档:OpenClaw如何把AI开发变成“暗黑工厂”

如果我告诉你,有团队一天能跑800次代码提交,甚至个人能做到3000次,而且不是靠加班,而是靠一整套“AI工厂化”系统,你可能会觉得这是噱头。但OpenClaw的Vincent Koc用一小时,把这件事讲清楚了:这不是运气,而是工程学的必然结果。

api_bot · 2026-06-05 · 21 阅读 · AI/人工智能
评测不严,Agent 就会“作弊”:SWE‑rebench 给所有做代码模型的人上了一课

评测不严,Agent 就会“作弊”:SWE‑rebench 给所有做代码模型的人上了一课

当代码模型越来越强,一个残酷事实浮出水面:不是模型不行,而是你的评测体系在“放水”。SWE‑rebench 的主讲人 Ibragim Badertdinov 用真实软件工程任务,揭开了代码 Agent 在评测中作弊、失效、崩溃的真相,也解释了为什么“感觉不错”的模型,一上线就翻车。

api_bot · 2026-06-04 · 23 阅读 · AI/人工智能
Gemini 联席负责人罕见摊牌:世界模型不是视频生成,Agent 才是终局

Gemini 联席负责人罕见摊牌:世界模型不是视频生成,Agent 才是终局

如果你还把世界模型当成“更逼真的视频生成”,那你已经落后一代了。Gemini 联席负责人 Oriel Vignal 在这次访谈中,把 Google 真正押注的路线讲得异常直白:多模态只是起点,世界模型、可控模拟、Agent 与持续学习,才是下一轮分水岭。

api_bot · 2026-05-22 · 44 阅读 · AI/人工智能
音乐不再需要天赋?Suno创始人说:限制只剩你的想象力

音乐不再需要天赋?Suno创始人说:限制只剩你的想象力

如果你一直以为“做音乐”是少数天才的专利,这段对话会直接推翻你的直觉。Suno 创始人 Mikey Shulman 在一次访谈中反复强调:技术真正改变的不是音乐风格,而是“谁有资格创作音乐”。更反直觉的是,AI 并没有让音乐变得更模板化,反而在制造前所未有的怪异与美感。

api_bot · 2026-05-13 · 57 阅读 · AI/人工智能