我让 Claude Code 写了 3 万行代码,结果惊到了

过去两个月,我做了一个实验。
用 Claude Code 从零开始搭建一个完整的 SaaS 项目——后端 API、数据库设计、前端页面、用户认证、支付集成、管理后台。全程让 AI 写,我只做决策和 review。
最终产出:3 万行代码,47 个 API 接口,12 个页面,完整的测试覆盖。
用时:6 周。如果纯手写,我估计需要 4-5 个月。
听起来是不是很完美?
是的。也不是。
这 3 万行代码教会了我关于 AI 编程的真相——既有让我惊叹的部分,也有让我后背发凉的部分。
惊到我的第一件事:速度
先说好的。
第一周,我搭好了整个后端架构。数据库 schema、ORM 模型、API 路由、中间件、错误处理、日志系统。以前这些至少要两周。
Claude Code 的工作方式跟手写代码完全不同。你不是”一行一行打字”,而是”一块一块描述”。
1 | "帮我设计一个多租户 SaaS 的数据库架构, |
10 分钟后,完整的 schema 出来了。不是那种玩具级别的——它考虑了索引优化、外键约束、枚举类型、时间戳字段,甚至还加了注释。
有个游戏开发者在 Reddit 上说了一句话我很认同:”那些通常要花一整天的功能,一个小时就搞定了。所有逻辑、机制、整个 UI、SDK 集成、存档系统——Claude 就是一口气吃掉了。”
这种速度不是”快一点”。是”快一个数量级”。
Reddit 上还有个更夸张的案例:有人用 Claude Code 在一个月的业余时间里,产出了一个 42 万行的 Python 代码库。
惊到我的第二件事:它会”遗忘”
到了第三周,代码量过了 1 万行,问题开始出现。
Claude Code 在写第 15 个 API 接口的时候,用了一种错误处理方式。这种方式跟前面 14 个接口完全不同。
不是因为它”学会了更好的方法”。是因为它忘了前面是怎么写的。
上下文窗口有极限。 当代码库增长到一定规模,AI 不可能把所有文件都装进脑子里。它开始丢失一致性。
同样的数据验证逻辑,在不同文件里被写了三种不同的实现。相同的工具函数,在两个地方被重新发明了一遍。命名规范从 camelCase 飘到了 snake_case,然后又飘回来。
一个做过大规模 Claude Code 项目的开发者总结得很到位:
“代码质量还行——代码能跑,测试通过。但随着代码库增长,你在 AI 生成的代码上不断叠加功能,东西很快就会变乱。”
我后来在 CLAUDE.md 里加了详细的编码规范和架构文档,情况好了很多。但这是我手动维护的——AI 不会自己保持一致性。
惊到我的第三件事:隐藏的债务
第四周,我做了一次全面的代码审查。不是看”能不能跑”,而是看”架构合不合理”。
结果让我出了一身冷汗。
重复代码量是手写项目的好几倍。 行业数据显示 AI 生成的代码库里重复代码增加了 8 倍,重构率下降了 39.9%。我的项目完全符合这个规律——Claude 更喜欢”再写一个”而不是”复用已有的”。
安全问题藏在细节里。 Forbes 引用的数据显示,AI 生成的代码安全缺陷是人类代码的 2.74 倍。一个安全审计机构扫描了 5,600 个 AI 构建的应用,发现了超过 2,000 个高危漏洞和 400 个暴露的密钥。
我自己的项目里也找到了几个问题:一个 API 接口缺少权限验证,一个文件上传没有做类型检查,还有一个环境变量被硬编码在了代码里(虽然是测试用的,但不该出现在代码里)。
最阴险的是”无主债务”。 InfoWorld 的一篇文章说得特别好:传统技术债务至少有作者——创造它的人记得为什么走了捷径、做了什么假设、需要改什么。AI 生成的债务不一样。没有人记得为什么这样写。没有人理解背后的假设。这是没有记忆的债务。
行业数据佐证了这一点:75% 的技术负责人预计到 2026 年将面临中度或重度的技术债务问题,原因正是 AI 加速开发跳过了长期结构性思考。这些问题通常在 30-90 天后才以生产事故的形式浮出水面。
惊到我的第四件事:它放大你的能力——也放大你的弱点
这可能是我最大的领悟。
有一篇分析文章说了一句我反复咀嚼的话:
“AI 工具放大已有的一切。强大的架构和清晰的规范会被放大为更快的交付。薄弱的基础会被放大为更快的债务积累。”
这就是我的真实体验。
在我擅长的领域——后端架构、API 设计、数据建模——Claude Code 把我的生产力提升了 5-10 倍。因为我知道什么是好的,我能迅速判断 AI 的输出是否合格,我能给出精准的反馈让它修正。
在我不擅长的领域——前端动画、CSS 布局细节——AI 的输出看起来”能用”,但我没有能力判断它是不是最优解。结果就是:前端部分积累了大量的技术债务,后来不得不请一个前端朋友帮我重构。
AI 不会弥补你的知识盲区。它会掩盖你的盲区,直到这些盲区变成生产事故。
一项被广泛讨论的数据显示:经验丰富的开发者使用 AI 工具后,效率反而下降了 19%。 这听起来反直觉,但如果你想想就明白了——资深开发者有自己的节奏和质量标准。AI 打破了这个节奏,增加了审查成本,有时候还需要返工修正 AI 的”创意发挥”。
而初级开发者用 AI 确实快了很多——但”快”和”好”是两回事。
我的最终结论:3 万行代码后的清单
6 周,3 万行代码。如果再来一次,我会怎么做?
一定要做的
1. CLAUDE.md 是你最重要的文件。 比任何代码文件都重要。把编码规范、架构决策、命名约定、禁止事项全部写进去。这是你跟 AI 的”团队章程”。
2. 每 2000 行做一次架构审查。 不要等到 3 万行的时候才回头看。定期检查一致性、重复代码、依赖关系。
3. 先 Plan Mode,后动手。 每一个超过 30 分钟的任务,都先让 Claude 进入 Plan Mode 读代码、分析、出方案。方案过了再执行。这一步省下的返工时间,远超你花在审批上的时间。
4. 安全不能交给 AI。 手动审查所有认证、授权、输入验证的代码。跑一遍静态安全扫描工具。在 CI/CD 里加安全检查。AI 会把安全限制当成”妨碍代码运行的 bug”来绕过。
5. 测试是你的护城河。 让 Claude 写测试,但你要审查测试用例是否覆盖了边界情况。有了好的测试,AI 可以自主修复失败的测试——这是一个正反馈循环。
绝对不要做的
1. 不要”盲飞”。 不要只看 UI 不看代码。这是 vibe coding 最大的坑。Andrej Karpathy(提出 vibe coding 这个词的人)自己都警告:如果不小心,agent 就是在生产”代码垃圾”。
2. 不要跳过 code review。 AI 写代码比你快 10 倍。但如果你不 review,你会在 30-90 天后收到 10 倍的生产事故。
3. 不要在不懂的领域全权委托。 如果你不理解一个领域,AI 能帮你启动,但不能帮你做对。找一个懂的人来审查,或者自己先学基础。
写在最后
3 万行代码之后,我对 AI 编程的态度从”盲目兴奋”变成了”清醒的乐观”。
速度是真实的。 6 周做完了 4-5 个月的工作量,这不是幻觉。
风险也是真实的。 安全漏洞、技术债务、一致性问题——这些不会因为你用了 AI 就消失。相反,它们可能来得更快、藏得更深。
2026 年的 AI 编程工具已经强到不可思议。但赢家不是生成代码最多的团队,而是生成正确代码的团队。
“不要问’怎么生产更多代码?’——要问’怎么验证更多代码?’这才是 2026 年真正的问题。”
你用 AI 写过最大的项目有多大?遇到过什么意想不到的坑?欢迎在评论区分享你的真实经历。