
AI编程工具带来高产低质困境:代码留存率成谜
管理软件有一句老话:衡量什么就得到什么。软件工程师几十年来一直在争论生产力指标,从代码行数开始。但随着新一代AI编程代理产出的代码比以往任何时候都多,管理者应该衡量什么,反而变得模糊不清。
核心问题在于:庞大的token预算——即开发者被授权消耗的AI处理能力——已成为硅谷开发者的荣誉象征,但这是一种非常奇怪的 productivity(生产力)衡量方式。当你更关心输出时,却去衡量输入,这几乎没有意义。
数据揭示的真相:代码接受率高,留存率低
“开发者生产力洞察”领域的新兴公司正在揭示这一矛盾。使用Claude Code、Cursor和Codex等工具的开发者,确实产出了比以往更多的被接受代码。但他们也发现,工程师需要更频繁地返回修改那些已被接受的代码,这削弱了生产力提升的说法。
Waydev CEO兼创始人Alex Circei正在构建追踪这些动态的智能层,其公司为50家客户、超过10000名软件工程师提供服务。他表示,工程经理看到的代码接受率高达80%至90%,但他们忽视了工程师在随后几周内必须修改代码所产生的churn(更替),这将实际留存率拉低至生成代码的10%至30%。
GitClear今年1月发布的报告发现,AI工具确实提升了生产力,但其数据显示“常规AI用户的代码churn率比非AI用户高出9.4倍”——是工具带来生产力增益的两倍多。
Faros AI则利用两年客户数据撰写了2026年3月报告,结论是:在高AI采用率下,代码churn(删除行数与新增行数的比率)增加了861%。
Jellyfish收集了2026年第一季度7548名工程师的数据,发现token预算最高的工程师产出了最多的pull request(向共享代码库提交的更改),但生产力提升并未成比例增长——他们的吞吐量达到两倍,但token成本却是十倍。
Senior与Junior工程师的差异
这些统计数据在与开发者交流时得到了验证。开发者们发现,尽管享受着新工具带来的自由,但代码审核&查验和技术债务却在堆积。一个普遍发现是:初级工程师接受的AI生成代码更多,因此也面临更多的重写工作,而高级工程师则相对较少。
尽管开发者仍在努力弄清楚他们的AI代理究竟在做什么,但他们预计不会很快倒退。Circei表示:“这是软件发展的新时代,你必须适应,公司也被迫适应。这不是一个会过去的周期。”


评论