我让 Claude Code 写了 3 万行代码，结果惊到了

发表于 2026-03-21 更新于 2026-07-13 分类于观点阅读次数：本文字数： 3k 阅读时长 ≈ 3 分钟

记录用 Claude Code 六周生成 3 万行代码、47 个 API 接口的 SaaS 实验，速度提升一个数量级，但代码库变大后出现一致性丢失、重复代码增加 8 倍、安全缺陷为人工 2.74 倍等隐性债务，建议维护 CLAUDE.md 并每 2000 行做架构审查。

cover

过去两个月，我做了一个实验。

用 Claude Code 从零开始搭建一个完整的 SaaS 项目——后端 API、数据库设计、前端页面、用户认证、支付集成、管理后台。全程让 AI 写，我只做决策和 review。

最终产出：3 万行代码，47 个 API 接口，12 个页面，完整的测试覆盖。

用时：6 周。如果纯手写，我估计需要 4-5 个月。

听起来是不是很完美？

是的。也不是。

这 3 万行代码教会了我关于 AI 编程的真相——既有让我惊叹的部分，也有让我后背发凉的部分。

惊到我的第一件事：速度

先说好的。

第一周，我搭好了整个后端架构。数据库 schema、ORM 模型、API 路由、中间件、错误处理、日志系统。以前这些至少要两周。

Claude Code 的工作方式跟手写代码完全不同。你不是”一行一行打字”，而是”一块一块描述”。

"帮我设计一个多租户 SaaS 的数据库架构，
支持组织、用户、角色权限、订阅计划。
用 PostgreSQL + Prisma。
要考虑软删除和审计日志。"

10 分钟后，完整的 schema 出来了。不是那种玩具级别的——它考虑了索引优化、外键约束、枚举类型、时间戳字段，甚至还加了注释。

有个游戏开发者在 Reddit 上说了一句话我很认同：”那些通常要花一整天的功能，一个小时就搞定了。所有逻辑、机制、整个 UI、SDK 集成、存档系统——Claude 就是一口气吃掉了。”

这种速度不是”快一点”。是”快一个数量级”。

Reddit 上还有个更夸张的案例：有人用 Claude Code 在一个月的业余时间里，产出了一个 42 万行的 Python 代码库。

惊到我的第二件事：它会”遗忘”

到了第三周，代码量过了 1 万行，问题开始出现。

Claude Code 在写第 15 个 API 接口的时候，用了一种错误处理方式。这种方式跟前面 14 个接口完全不同。

不是因为它”学会了更好的方法”。是因为它忘了前面是怎么写的。

上下文窗口有极限。 当代码库增长到一定规模，AI 不可能把所有文件都装进脑子里。它开始丢失一致性。

同样的数据验证逻辑，在不同文件里被写了三种不同的实现。相同的工具函数，在两个地方被重新发明了一遍。命名规范从 camelCase 飘到了 snake_case，然后又飘回来。

一个做过大规模 Claude Code 项目的开发者总结得很到位：

“代码质量还行——代码能跑，测试通过。但随着代码库增长，你在 AI 生成的代码上不断叠加功能，东西很快就会变乱。”

我后来在 CLAUDE.md 里加了详细的编码规范和架构文档，情况好了很多。但这是我手动维护的——AI 不会自己保持一致性。

惊到我的第三件事：隐藏的债务

第四周，我做了一次全面的代码审查。不是看”能不能跑”，而是看”架构合不合理”。

结果让我出了一身冷汗。

重复代码量是手写项目的好几倍。 行业数据显示 AI 生成的代码库里重复代码增加了 8 倍，重构率下降了 39.9%。我的项目完全符合这个规律——Claude 更喜欢”再写一个”而不是”复用已有的”。

安全问题藏在细节里。 Forbes 引用的数据显示，AI 生成的代码安全缺陷是人类代码的 2.74 倍。一个安全审计机构扫描了 5,600 个 AI 构建的应用，发现了超过 2,000 个高危漏洞和 400 个暴露的密钥。

我自己的项目里也找到了几个问题：一个 API 接口缺少权限验证，一个文件上传没有做类型检查，还有一个环境变量被硬编码在了代码里（虽然是测试用的，但不该出现在代码里）。

最阴险的是”无主债务”。 InfoWorld 的一篇文章说得特别好：传统技术债务至少有作者——创造它的人记得为什么走了捷径、做了什么假设、需要改什么。AI 生成的债务不一样。没有人记得为什么这样写。没有人理解背后的假设。这是没有记忆的债务。

行业数据佐证了这一点：75% 的技术负责人预计到 2026 年将面临中度或重度的技术债务问题，原因正是 AI 加速开发跳过了长期结构性思考。这些问题通常在 30-90 天后才以生产事故的形式浮出水面。

惊到我的第四件事：它放大你的能力——也放大你的弱点

这可能是我最大的领悟。

有一篇分析文章说了一句我反复咀嚼的话：

“AI 工具放大已有的一切。强大的架构和清晰的规范会被放大为更快的交付。薄弱的基础会被放大为更快的债务积累。”

这就是我的真实体验。

在我擅长的领域——后端架构、API 设计、数据建模——Claude Code 把我的生产力提升了 5-10 倍。因为我知道什么是好的，我能迅速判断 AI 的输出是否合格，我能给出精准的反馈让它修正。

在我不擅长的领域——前端动画、CSS 布局细节——AI 的输出看起来”能用”，但我没有能力判断它是不是最优解。结果就是：前端部分积累了大量的技术债务，后来不得不请一个前端朋友帮我重构。

AI 不会弥补你的知识盲区。它会掩盖你的盲区，直到这些盲区变成生产事故。

一项被广泛讨论的数据显示：经验丰富的开发者使用 AI 工具后，效率反而下降了 19%。 这听起来反直觉，但如果你想想就明白了——资深开发者有自己的节奏和质量标准。AI 打破了这个节奏，增加了审查成本，有时候还需要返工修正 AI 的”创意发挥”。

而初级开发者用 AI 确实快了很多——但”快”和”好”是两回事。

我的最终结论：3 万行代码后的清单

6 周，3 万行代码。如果再来一次，我会怎么做？

一定要做的

1. CLAUDE.md 是你最重要的文件。 比任何代码文件都重要。把编码规范、架构决策、命名约定、禁止事项全部写进去。这是你跟 AI 的”团队章程”。

2. 每 2000 行做一次架构审查。 不要等到 3 万行的时候才回头看。定期检查一致性、重复代码、依赖关系。

3. 先 Plan Mode，后动手。 每一个超过 30 分钟的任务，都先让 Claude 进入 Plan Mode 读代码、分析、出方案。方案过了再执行。这一步省下的返工时间，远超你花在审批上的时间。

4. 安全不能交给 AI。 手动审查所有认证、授权、输入验证的代码。跑一遍静态安全扫描工具。在 CI/CD 里加安全检查。AI 会把安全限制当成”妨碍代码运行的 bug”来绕过。

5. 测试是你的护城河。 让 Claude 写测试，但你要审查测试用例是否覆盖了边界情况。有了好的测试，AI 可以自主修复失败的测试——这是一个正反馈循环。

绝对不要做的

1. 不要”盲飞”。 不要只看 UI 不看代码。这是 vibe coding 最大的坑。Andrej Karpathy（提出 vibe coding 这个词的人）自己都警告：如果不小心，agent 就是在生产”代码垃圾”。

2. 不要跳过 code review。 AI 写代码比你快 10 倍。但如果你不 review，你会在 30-90 天后收到 10 倍的生产事故。

3. 不要在不懂的领域全权委托。 如果你不理解一个领域，AI 能帮你启动，但不能帮你做对。找一个懂的人来审查，或者自己先学基础。

写在最后

3 万行代码之后，我对 AI 编程的态度从”盲目兴奋”变成了”清醒的乐观”。

速度是真实的。 6 周做完了 4-5 个月的工作量，这不是幻觉。

风险也是真实的。 安全漏洞、技术债务、一致性问题——这些不会因为你用了 AI 就消失。相反，它们可能来得更快、藏得更深。

2026 年的 AI 编程工具已经强到不可思议。但赢家不是生成代码最多的团队，而是生成正确代码的团队。

“不要问’怎么生产更多代码？’——要问’怎么验证更多代码？’这才是 2026 年真正的问题。”

你用 AI 写过最大的项目有多大？遇到过什么意想不到的坑？欢迎在评论区分享你的真实经历。