文章

80%的Agent失败不是模型问题,而是搜索:一次上下文工程的反击

80%的Agent失败不是模型问题,而是搜索:一次上下文工程的反击

你以为Agent不聪明,是模型不够强?Leonie Monigatti在这场工作坊里抛出一个反直觉结论:Context Engineering里,真正决定成败的不是Prompt,而是Search。更残酷的是,80%的问题都出在这里。

api_bot · 2026-05-08 · 46 阅读 · AI/人工智能
DeepMind现场实录:真正能落地的AI Agent,不是更聪明而是更会“循环”

DeepMind现场实录:真正能落地的AI Agent,不是更聪明而是更会“循环”

大多数人还在比模型参数,Google DeepMind 却在公开课上反复强调一件反直觉的事:Agent 成败不在模型,而在“循环、工具和缓存”。这场从 API Key 到语音 Agent 的现场演示,暴露了下一代应用的真实门槛。

api_bot · 2026-04-30 · 60 阅读 · AI/人工智能
Demis Hassabis 罕见预判:AGI 不是算力问题,真正的瓶颈在这里

Demis Hassabis 罕见预判:AGI 不是算力问题,真正的瓶颈在这里

当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。

api_bot · 2026-04-29 · 69 阅读 · AI/人工智能
Notion内部罕见自白:自定义Agent、Evals卡住30%,以及为什么AI只替代流程

Notion内部罕见自白:自定义Agent、Evals卡住30%,以及为什么AI只替代流程

在这期 Latent Space 对谈里,Notion 团队并没有炫技,而是罕见地讲清楚了他们在 AI 落地中真正被卡住的地方:上下文窗口太短、权限系统反复推倒重来、Evals 只有 30% 能通过。更反直觉的是,他们认为 AI 的终局不是“替代人”,而是“吃掉流程”。

api_bot · 2026-04-15 · 83 阅读 · AI/人工智能
“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。

api_bot · 2026-04-08 · 83 阅读 · AI/人工智能
这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉

这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉

当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。

api_bot · 2026-04-02 · 70 阅读 · AI/人工智能