正在加载视频...
视频章节
很多 AI 从业者都遇到过同一个怪现象:模型很强,Agent 一跑就崩。这期 Latent Space 把 Dex Horthy 拉进厨房,一边做酱,一边拆解了 AI Agent 失败的真正原因——答案不在模型,而在“上下文”和人类介入的方式。
为什么你的 AI Agent 总是翻车?一场“做酱”现场给了答案
很多 AI 从业者都遇到过同一个怪现象:模型很强,Agent 一跑就崩。这期 Latent Space 把 Dex Horthy 拉进厨房,一边做酱,一边拆解了 AI Agent 失败的真正原因——答案不在模型,而在“上下文”和人类介入的方式。
开场就不讲模型:AI Agent 失败,和“火候”有关
视频一开始完全不像一场技术访谈:镜头对准的是锅里的酱汁,“Look at that sauce”。但这不是噱头,而是隐喻。Dex Horthy 反复强调,很多 AI Agent 的问题,不是算法不够先进,而是实现方式“太天真”——就像用一个教科书级的 Dijkstra 算法,直接拿去跑真实世界的复杂路径。
在 Agent 世界里,大家默认只要把 LLM 接上工具、给个目标,它就会自己规划、自己执行。但现实是:Agent 经常在看似合理、实则错误的路径里兜圈子,最后把系统拖进不可恢复的状态。Dex 把这种情况形容为“味道不对,但你一开始尝不出来”。
Context Engineering 走红的真正原因:大家都被 Agent 坑过
当聊到 Dex 如何进入 context engineering 这个领域时,他提到一个关键信号:这个词在某个时间点突然“爆了”。原因很简单——几乎所有认真做 Agent 的团队,都撞上了同一面墙。
很多人最初的假设是:Prompt 写好一点就行。但很快发现,真正决定 Agent 行为质量的,是“上下文如何被组织、更新和裁剪”。上下文不是越长越好,而是要像做菜一样,知道什么时候加料、什么时候收。
视频里有一句很有代表性的总结:大家嘴上说模型不行,实际上是在为糟糕的上下文管理买单。这也是为什么 context engineering 从“边角活”变成了核心能力。
Human-in-the-loop 不是倒退,而是避开 Agent 的“死区”
Dex 提到了一个很重要的概念:dead zone。那是一种状态——问题已经超出了当前 Agent 的能力边界,但系统本身却意识不到,还在自信地往前跑。
这正是纯自动化 Agent 最危险的地方。不是它不会做事,而是它不知道什么时候该停。Dex 的观点很明确:在关键节点引入人类,不是削弱 Agent,而是让系统整体变得更可靠。
这也是 HumanLayer 这类工具存在的逻辑基础:不是让人类接管一切,而是在“可能翻车”的瞬间,让人类成为安全阀。就像做酱时突然尝一口,发现需要多一点辣。
从 Replicate 到 Agent 实战:工程细节才是分水岭
在聊到 Dex 之前在 Replicate 的经历时,话题自然转向了“工艺”。很多人低估了工程层面对 Agent 成败的影响。
视频中反复出现一个对比:想象中的 Agent vs 真实运行的 Agent。前者像是 CEO 视角的自动化幻想,后者更像是在复杂厨房里同时看着十口锅。
真正成熟的 Agent 系统,往往不是最酷的,而是最啰嗦的:有检查、有回退、有日志、有人工确认点。这些看似不性感的设计,恰恰决定了 Agent 能不能长期跑下去。
对未来的判断:Agent 会更慢,但也更能用
当被问到对未来的预测时,Dex 的态度并不激进。他并不认为 Agent 会在短期内全面“自主化”。相反,Agent 的演进路径更可能是:能力边界逐步外扩,但人类始终在环内。
就像视频结尾反复出现的那句调侃——“加一点点香料”。不是推翻重来,而是持续微调。Agent 的竞争力,未来不在于谁的模型参数更多,而在于谁更懂得如何控制系统的味道。
总结
这期视频真正戳中的,是一个很多 AI 从业者不愿承认的事实:Agent 失败,往往不是技术不够前沿,而是工程和设计太草率。对你来说,最直接的行动建议有三个:第一,把“上下文管理”当成一等公民,而不是 Prompt 的附属品;第二,认真设计 human-in-the-loop 的介入点;第三,不要迷信全自动,稳定可控比炫技更重要。下一次你的 Agent 又翻车时,别急着换模型,先尝一口“酱”,看看是不是火候的问题。
关键词: AI Agent, Context Engineering, Human-in-the-loop, HumanLayer, Replicate
事实核查备注: 需要核查:1)Dex Horthy 的身份与其与 HumanLayer 的关系;2)Context engineering 走红的具体时间点(视频中提到“April”);3)Dex 曾在 Replicate 的具体角色;4)视频中关于 dead zone 的原始表述语境。