AI把代码写快了,却让评审崩溃:Graphite眼中的新开发范式

AI PM 编辑部 · 2025年06月27日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

当AI大幅加速写代码的“内循环”,测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题,以及为什么未来的开发工具必须是“AI原生”的。

AI把代码写快了,却让评审崩溃:Graphite眼中的新开发范式

当AI大幅加速写代码的“内循环”,测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题,以及为什么未来的开发工具必须是“AI原生”的。

两个循环的失衡:AI正在撕裂传统开发流程

要理解Graphite在解决什么问题,首先要理解Tomas Reimers提出的一个判断:软件开发从来都由两个循环组成。一个是开发者最熟悉的“内循环”——写代码、调试、让功能跑起来;另一个是更缓慢却同样关键的“外循环”——测试、评审、合并、部署。

这个结构长期保持稳定,但AI的出现第一次系统性地打破了平衡。Tomas在演讲中指出,内循环的变化“比以往任何时候都要剧烈”。几乎所有开发者都在使用AI工具,GitHub开发者调查显示,近乎100%的受访者在工作内外使用AI,而GitHub上约46%的代码已经由Copilot生成。

结果是显而易见的:代码产量暴增,但质量控制的方式并没有同步进化。开发者可以在Cursor、Copilot等工具的帮助下快速生成大量代码,却仍然需要人工一行行地Review、跑CI、处理失败、协调合并。Tomas形容这种状态时非常直白:“内循环被加速了,但外循环正在变成新的瓶颈。”

这并不是效率提升后的幸福烦恼,而是一种结构性失衡——过去只在超大规模工程团队中出现的问题,正在被所有公司普遍体验到。

当AI写代码,也会制造新风险

很多人乐于谈论AI提升了多少生产力,但Tomas选择从更冷静的角度切入:AI不仅写得快,也会犯错,而且这些错误并不总是显而易见。

在Graphite最早构建自家AI代码审查工具Diamond时,团队很快发现一个现实问题:AI会“幻觉”,会在看似合理的代码中引入逻辑错误,甚至安全漏洞。这意味着,代码评审的重要性不降反升。

问题在于,评审的负担已经远远超过了人类可以线性扩展的程度。Tomas提到,像Cursor、Windsurf、Copilot这样的工具正在以前所未有的速度制造变更,这迫使团队去Review、测试、合并和部署“更多的代码,而不是更好的代码”。

正是在这种背景下,Graphite形成了一个关键判断:外循环不能再只是“更多人+更多时间”。它需要新的能力,包括更好的优先级排序、变更追踪、Reviewer辅助、优化过的CI流水线、合并队列以及更智能的部署工具。这不是单点工具能解决的问题,而是一整套流程的重构。

用AI解决AI的问题:为什么“自驾式代码评审”不是噱头

从AI优先(AI-first)的视角出发,Graphite得出了一个看似简单但执行难度极高的结论:既然问题是AI带来的,那解决方案也必须是AI。

Tomas把他们的目标描述为“self-driving code review(自驾式代码评审)”。核心不是让机器人取代人类,而是移除那些最机械、最消耗心智的步骤,让开发者重新专注于交付真正可用的功能。

但他也明确强调了一个边界:“AI生成的反馈并不完美,光靠机器人是不够的。”如果只是往现有流程里塞一个Bot,结果只会是更多噪音。因此,Graphite并没有把自己定位成一个IDE插件,而是试图让整个工具链变成“AI原生”。

这个判断背后有一个清晰的逻辑:如果开发者的产出真的会呈数量级提升,那么Review、CI、Merge、Deploy这些环节也必须具备同样的扩展能力,否则系统一定会在外循环崩溃。

Diamond的具体做法:高信号、低噪音的AI评审

在具体实现上,Graphite从“信噪比”入手构建了Diamond。Tomas形容它是一个“high signal, low noise”的AI代码评审平台,核心能力来自对代码库和历史变更的深度理解。

Diamond并不是简单地给PR写评论,而是先做摘要和优先级判断,再针对每一次变更给出审查意见。同时,它与CI和测试基础设施集成,可以自动总结错误、指出失败原因,甚至提出修复建议。

随着产品在更大规模客户中的落地,Graphite观察到几个稳定结果:代码评审周期缩短、质量和一致性被强制执行,以及对隐私和安全的严格保障。Tomas特别强调,Diamond是“零配置”的,并且所有建议都可以一键操作和高度定制。

最有意思的是一组数据对比:AI Bot的评论被下载的比例不到4%,但一旦被看到,其被接受的比例却高于人类评论。人类评论的集成率约为45%到50%,而Diamond的评论约为52%。Tomas直言:“我们在这上面花了大量时间调优。”

AI不只是IDE插件,而是整个工作流的重构

在演讲的最后,Tomas把话题重新拉回开发者自身。他希望大家能真正接受一个观念:AI改变的不是你用什么IDE,而是你整个开发工作流的形态。

当代码生成几乎不再是瓶颈时,真正决定效率和质量的,是外循环是否足够智能、足够自动化、足够可控。否则,团队只是在用更快的速度,把更多未经充分消化的代码推向生产环境。

Graphite的尝试并不只是推广一个产品,而是在提醒行业:工具链的每一个环节,都必须假设“代码将由AI大量生成”这一前提。只有在这个前提下重新设计流程,AI带来的生产力红利才不会演变成系统性风险。

总结

这场演讲最有价值的地方,不在于Graphite做了什么功能,而在于Tomas Reimers对开发范式转移的判断:AI正在重塑内循环,而外循环必须同步进化。否则,代码写得越快,团队反而越容易“被一击致命”。对开发者和技术负责人来说,真正的问题已经不是“要不要用AI写代码”,而是“你的评审、测试和部署流程,是否已经为AI时代做好准备”。


关键词: AI代码评审, 开发者工作流, Graphite, Diamond, GitHub Copilot

事实核查备注: 演讲者:Tomas Reimers(Graphite联合创始人);产品:Graphite、Diamond、GitHub Copilot、Cursor、Windsurf;关键数据:GitHub约46%代码由Copilot生成;Diamond评论接受率约52%,人类评论约45%-50%;AI Bot评论下载率低于4%;核心概念:内循环/外循环、AI幻觉、自驾式代码评审。