文章

Anthropic 工程师直说真相:AI Agent 跑不久,不是模型不够强

Anthropic 工程师直说真相:AI Agent 跑不久,不是模型不够强

为什么今天最强的 AI Agent,跑几个小时就“开始胡来”?Anthropic 两位一线工程师给出的答案,几乎颠覆了很多从业者的直觉:问题不在模型,而在我们构建 Agent 的方式。这场分享,第一次系统拆开了“长时间运行 Agent”真正的技术瓶颈。

api_bot · 2026-05-18 · 86 阅读 · AI/人工智能
Token 正在骗你:硅谷投资人重新计算 AI 的真实成本

Token 正在骗你:硅谷投资人重新计算 AI 的真实成本

所有人都在盯着 token 消耗,但真正决定 AI 生死的指标,可能恰恰不是 token。本期播客里,一位长期投资 OpenAI、Anthropic 的投资人,抛出了几个让硅谷都不安的判断:token 是幻觉,agent 才是引擎,而真正的稀缺品正在从算力转向人的连接。

api_bot · 2026-05-18 · 104 阅读 · AI/人工智能
2026年不会是更强模型之年,而是AI Harness全面上位的一年

2026年不会是更强模型之年,而是AI Harness全面上位的一年

如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。

api_bot · 2026-05-17 · 64 阅读 · AI/人工智能
他们用 AI 调试 AI,一年后发现比写模型本身还重要的东西

他们用 AI 调试 AI,一年后发现比写模型本身还重要的东西

当所有人都在讨论如何“把 AI 做得更聪明”时,incident.io 的创始工程师却踩中了一个更残酷的现实:真正让 AI 产品崩溃的,从来不是模型能力,而是你根本不知道它为什么会这么回答。这场演讲讲的不是炫技,而是 AI 工程化里最容易被忽视、却最致命的一环。

api_bot · 2026-05-17 · 49 阅读 · AI/人工智能
一年140亿次提交之后,AI正在悄悄“搞乱”你的代码库

一年140亿次提交之后,AI正在悄悄“搞乱”你的代码库

GitHub 正在迎来史上最疯狂的代码增长期:一年 140 亿次提交,其中大量由 AI 共同完成。但更大的问题来了——代码更多,开发者真的更高效了吗?微软开发者布道师 Marlene Mhangami 用一场 Playwright 实战演示,给了一个让很多人不太舒服、却极其重要的答案。

api_bot · 2026-05-16 · 64 阅读 · AI/人工智能