AI把代码写快了，却让评审崩溃：Graphite眼中的新开发范式

AI PM 编辑部 · 2025年06月27日 · 19 阅读 · AI/人工智能

代码生成 AI应用 AI工具生成式AI 模型部署幻觉 GitHub Copilot Cursor

正在加载视频...

视频章节

当AI大幅加速写代码的“内循环”，测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题，以及为什么未来的开发工具必须是“AI原生”的。

AI把代码写快了，却让评审崩溃：Graphite眼中的新开发范式

当AI大幅加速写代码的“内循环”，测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题，以及为什么未来的开发工具必须是“AI原生”的。

两个循环的失衡：AI正在撕裂传统开发流程

要理解Graphite在解决什么问题，首先要理解Tomas Reimers提出的一个判断：软件开发从来都由两个循环组成。一个是开发者最熟悉的“内循环”——写代码、调试、让功能跑起来；另一个是更缓慢却同样关键的“外循环”——测试、评审、合并、部署。

这个结构长期保持稳定，但AI的出现第一次系统性地打破了平衡。Tomas在演讲中指出，内循环的变化“比以往任何时候都要剧烈”。几乎所有开发者都在使用AI工具，GitHub开发者调查显示，近乎100%的受访者在工作内外使用AI，而GitHub上约46%的代码已经由Copilot生成。

结果是显而易见的：代码产量暴增，但质量控制的方式并没有同步进化。开发者可以在Cursor、Copilot等工具的帮助下快速生成大量代码，却仍然需要人工一行行地Review、跑CI、处理失败、协调合并。Tomas形容这种状态时非常直白：“内循环被加速了，但外循环正在变成新的瓶颈。”

这并不是效率提升后的幸福烦恼，而是一种结构性失衡——过去只在超大规模工程团队中出现的问题，正在被所有公司普遍体验到。

当AI写代码，也会制造新风险

很多人乐于谈论AI提升了多少生产力，但Tomas选择从更冷静的角度切入：AI不仅写得快，也会犯错，而且这些错误并不总是显而易见。

在Graphite最早构建自家AI代码审查工具Diamond时，团队很快发现一个现实问题：AI会“幻觉”，会在看似合理的代码中引入逻辑错误，甚至安全漏洞。这意味着，代码评审的重要性不降反升。

问题在于，评审的负担已经远远超过了人类可以线性扩展的程度。Tomas提到，像Cursor、Windsurf、Copilot这样的工具正在以前所未有的速度制造变更，这迫使团队去Review、测试、合并和部署“更多的代码，而不是更好的代码”。

正是在这种背景下，Graphite形成了一个关键判断：外循环不能再只是“更多人+更多时间”。它需要新的能力，包括更好的优先级排序、变更追踪、Reviewer辅助、优化过的CI流水线、合并队列以及更智能的部署工具。这不是单点工具能解决的问题，而是一整套流程的重构。

用AI解决AI的问题：为什么“自驾式代码评审”不是噱头

从AI优先（AI-first）的视角出发，Graphite得出了一个看似简单但执行难度极高的结论：既然问题是AI带来的，那解决方案也必须是AI。

Tomas把他们的目标描述为“self-driving code review（自驾式代码评审）”。核心不是让机器人取代人类，而是移除那些最机械、最消耗心智的步骤，让开发者重新专注于交付真正可用的功能。

但他也明确强调了一个边界：“AI生成的反馈并不完美，光靠机器人是不够的。”如果只是往现有流程里塞一个Bot，结果只会是更多噪音。因此，Graphite并没有把自己定位成一个IDE插件，而是试图让整个工具链变成“AI原生”。

这个判断背后有一个清晰的逻辑：如果开发者的产出真的会呈数量级提升，那么Review、CI、Merge、Deploy这些环节也必须具备同样的扩展能力，否则系统一定会在外循环崩溃。

Diamond的具体做法：高信号、低噪音的AI评审

在具体实现上，Graphite从“信噪比”入手构建了Diamond。Tomas形容它是一个“high signal， low noise”的AI代码评审平台，核心能力来自对代码库和历史变更的深度理解。

Diamond并不是简单地给PR写评论，而是先做摘要和优先级判断，再针对每一次变更给出审查意见。同时，它与CI和测试基础设施集成，可以自动总结错误、指出失败原因，甚至提出修复建议。

随着产品在更大规模客户中的落地，Graphite观察到几个稳定结果：代码评审周期缩短、质量和一致性被强制执行，以及对隐私和安全的严格保障。Tomas特别强调，Diamond是“零配置”的，并且所有建议都可以一键操作和高度定制。

最有意思的是一组数据对比：AI Bot的评论被下载的比例不到4%，但一旦被看到，其被接受的比例却高于人类评论。人类评论的集成率约为45%到50%，而Diamond的评论约为52%。Tomas直言：“我们在这上面花了大量时间调优。”

AI不只是IDE插件，而是整个工作流的重构

在演讲的最后，Tomas把话题重新拉回开发者自身。他希望大家能真正接受一个观念：AI改变的不是你用什么IDE，而是你整个开发工作流的形态。

当代码生成几乎不再是瓶颈时，真正决定效率和质量的，是外循环是否足够智能、足够自动化、足够可控。否则，团队只是在用更快的速度，把更多未经充分消化的代码推向生产环境。

Graphite的尝试并不只是推广一个产品，而是在提醒行业：工具链的每一个环节，都必须假设“代码将由AI大量生成”这一前提。只有在这个前提下重新设计流程，AI带来的生产力红利才不会演变成系统性风险。

总结

这场演讲最有价值的地方，不在于Graphite做了什么功能，而在于Tomas Reimers对开发范式转移的判断：AI正在重塑内循环，而外循环必须同步进化。否则，代码写得越快，团队反而越容易“被一击致命”。对开发者和技术负责人来说，真正的问题已经不是“要不要用AI写代码”，而是“你的评审、测试和部署流程，是否已经为AI时代做好准备”。

关键词： AI代码评审，开发者工作流， Graphite， Diamond， GitHub Copilot

事实核查备注：演讲者：Tomas Reimers（Graphite联合创始人）；产品：Graphite、Diamond、GitHub Copilot、Cursor、Windsurf；关键数据：GitHub约46%代码由Copilot生成；Diamond评论接受率约52%，人类评论约45%-50%；AI Bot评论下载率低于4%；核心概念：内循环/外循环、AI幻觉、自驾式代码评审。

返回文章列表