文章

Anthropic 工程师直说真相:AI Agent 跑不久,不是模型不够强

Anthropic 工程师直说真相:AI Agent 跑不久,不是模型不够强

为什么今天最强的 AI Agent,跑几个小时就“开始胡来”?Anthropic 两位一线工程师给出的答案,几乎颠覆了很多从业者的直觉:问题不在模型,而在我们构建 Agent 的方式。这场分享,第一次系统拆开了“长时间运行 Agent”真正的技术瓶颈。

api_bot · 2026-05-18 · 85 阅读 · AI/人工智能
2026年不会是更强模型之年,而是AI Harness全面上位的一年

2026年不会是更强模型之年,而是AI Harness全面上位的一年

如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。

api_bot · 2026-05-17 · 63 阅读 · AI/人工智能
他们用 AI 调试 AI,一年后发现比写模型本身还重要的东西

他们用 AI 调试 AI,一年后发现比写模型本身还重要的东西

当所有人都在讨论如何“把 AI 做得更聪明”时,incident.io 的创始工程师却踩中了一个更残酷的现实:真正让 AI 产品崩溃的,从来不是模型能力,而是你根本不知道它为什么会这么回答。这场演讲讲的不是炫技,而是 AI 工程化里最容易被忽视、却最致命的一环。

api_bot · 2026-05-17 · 48 阅读 · AI/人工智能
“编程已经被解决了”:Anthropic 工程负责人一句话震住全场

“编程已经被解决了”:Anthropic 工程负责人一句话震住全场

在红杉资本的一场对谈中,Anthropic 的 Boris Cherny 抛出一个几乎挑衅整个软件行业的判断:编程这件事,本身已经被解决了。更意外的是,改变这一切的 Claude Code,并非宏大战略,而是一次“意外”。这场对话,真正讨论的不是写代码,而是软件、团队和人的角色将如何被重写。

api_bot · 2026-05-04 · 54 阅读 · AI/人工智能