Booking.com如何把AI Agent变成真实ROI,而不只是噱头

AI PM 编辑部 · 2025年04月08日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

很多企业都在“上AI”,却答不出ROI。Booking.com与Sourcegraph分享了一条少见的路径:从真实的工程痛点出发,用AI Agent逐步吞掉软件开发中的高比例“toil”,并用严格的数据证明,开发者效率确实提升了30%以上。

Booking.com如何把AI Agent变成真实ROI,而不只是噱头

很多企业都在“上AI”,却答不出ROI。Booking.com与Sourcegraph分享了一条少见的路径:从真实的工程痛点出发,用AI Agent逐步吞掉软件开发中的高比例“toil”,并用严格的数据证明,开发者效率确实提升了30%以上。

为什么“AI上了,但没人敢算ROI”?

这一场对话的起点,其实是一个在大型公司里反复上演的场景:CEO要求“我们要用AI”,团队匆忙采购或上线Copilot式工具,半年后,CFO追问一句——“那ROI呢?”

Sourcegraph联合创始人兼CTO Beyang 和 Booking.com 开发者体验负责人 Bruno Pasos 都承认,这是当前企业AI落地最棘手的问题之一。AI工具不缺,演示也不缺,真正缺的是可被财务、管理层认可的“可度量价值”。

Bruno 的判断很克制。他直言 Booking 并不是“已经领先”,而是“刚刚开始”,但他们有一个明确的原则:不迷信一次性的大爆发,而是“对实验保持极度耐心,对数据保持近乎偏执的执着”。这句话背后,是他们在过去一年里不断试错、回滚、重新设计指标体系的真实经历。

这也构成了本次分享最重要的前提:AI Agent 不是战略口号,而是一项需要嵌入现有 SDLC(软件开发生命周期)、并且接受 KPI 审视的工程能力。

当代码库膨胀,90%的时间都在“做无意义的事”

理解 Booking.com 为什么愿意在 AI Agent 上投入,必须先理解他们的工程处境。

Bruno 用一组极具画面感的描述,概括了大型成熟公司常见的代码现实:代码库不断膨胀,历史包袱越来越重,开发周期被拉长,真正写“新价值代码”的时间反而被压缩。他抛出了一个让现场开发者频频点头的数据——在某些场景下,开发者 90% 的时间都花在 toil 上。

Toil 指的是那些“必须做、但几乎不产生长期价值”的工作,例如排查旧逻辑、理解陈年 feature flag、机械式修改、重复性重构。Bruno 甚至半开玩笑地引用了一句极具文学性的吐槽:“我见过我这一代最优秀的开发者,被长达十年的 feature flag 折磨到精神崩溃。”

正是这种长期积累的工程债,才让他们意识到:如果 AI 只是帮你写几行新代码,价值有限;真正的机会在于,让 AI 接管外围、低价值、却极度消耗认知带宽的工作。

Sourcegraph的答案:不是更聪明的Copilot,而是Agent

Beyang 在这一部分系统性地解释了 Sourcegraph 的思路。他们并不是把目标放在“写得更快”,而是“让在大规模、混乱代码库中开发这件事本身变得可控”。

Sourcegraph 的 AI 编码助手 Cody,被定义为“上下文感知的代码生成器”。这里的上下文,并不只是当前文件,而是整个代码图谱——跨仓库、跨语言、跨历史。对 Booking 这样的公司而言,这是普通 Copilot 难以胜任的环境。

但真正的转折点,是从工具走向 Agent。Bruno 回顾了一个关键阶段:最初他们小心翼翼地加各种 guard rail,限制模型能力;后来逐渐意识到,如果想验证真实潜力,必须“移除护栏”,让 Agent 真正参与到完整流程中。

从 7 月开始,他们系统性地训练开发者使用这些能力,同时引入更细粒度的指标追踪。到了 11 月底,团队在真实数据中看到了变化:使用 Cody 和相关 Agent 的开发者,交付速度提升了 30% 以上。这不是主观感受,而是从行为日志和工程指标中反推得出的结论。

三个Agent案例:搜索、理解、代码审查

相比抽象方法论,这次分享中最有价值的部分,是几个具体 Agent 的诞生过程。

第一个来自一次内部黑客松。工程师们“受够了”手动在巨大代码图中追溯依赖关系,于是构建了一个 Agent,能够在极其复杂的代码图中自动搜索、定位和汇总关键信息。过去需要数周、甚至数月才能完成的理解过程,被压缩到可交互的时间尺度内。

第二个 Agent 的目标是“代码理解本身”。它不是生成新代码,而是帮助开发者快速理解陌生模块,尤其适合新成员或跨团队协作。这直接减少了 onboarding 和跨域协作的隐性成本。

最后一个、也是最贴近日常工作的,是代码审查 Agent。Booking 内部有大量历史积累下来的规则和规范,人类 reviewer 很难完全一致地执行。这个 Agent 的核心思路是:先定义规则,再用 Agent 自动对变更进行检查,把反馈精准推送给开发者。

Bruno 强调,这些 Agent 并不是要“取代人”,而是把人从高频、低价值的判断中解放出来。

总结

这场对话真正打动人的地方,并不在于模型多先进,而在于一套极其务实的路径:从真实工程痛点出发,让 AI Agent 逐步吞噬 toil,用清晰的 KPI 验证价值。30% 的效率提升并不是终点,而是他们用来“自证合理性”的起点。对于任何试图在企业环境中落地 AI 的团队来说,这可能是比任何炫酷 Demo 都更值得参考的答案。


关键词: AI Agent, Sourcegraph, Booking.com, 开发者效率, 企业AI ROI

事实核查备注: 人物:Beyang(Sourcegraph 联合创始人兼CTO)、Bruno Pasos(Booking.com 开发者体验负责人);公司:Sourcegraph、Booking.com;产品/工具:Cody(AI 编码助手);关键数字:开发者速度提升30%以上;概念:AI Agent、toil、SDLC、代码审查 Agent