Claude Code 官方的十条心法,一半我天天在用,另一半戳得我疼

哈喽,我是飞飞。
这两天刷 X,看到 Claude Code 团队的 Thariq 发了条视频,讲他们自己人是怎么用这套工具的,一共十条建议。我的第一反应挺敷衍:官方教学嘛,还能教出花来?结果开头一句就把我按住了。他说,过去他们检查 Claude 有没有把活干对,现在改成检查它是不是在干对的活。
更气人的是他顺手补了一刀:这条视频本身,就是他用 Claude Fable 5 剪出来的。
那句总纲,值得先掰开
「检查做对没」和「检查在做对的事」,听着像绕口令,差别其实很硬。前者是盯过程:逐行看 diff 改了哪儿、抓它有没有偷懒提前收工、防它把测试改了凑绿灯。后者是盯方向:目标对不对、路线偏没偏,至于每一行代码怎么写,让它自己跟自己较劲去。
为什么这个转变现在才敢提?官方自己拆过单个上下文窗口的三种死法。
一种是干一半宣布完工,五十个文件审到三十五个就说审完了。一种是自己阅自己的卷,写代码和验代码的是同一个脑子,必然偏心。还有一种是聊久了跑题,几十轮对话加上下文压缩,最初的要求被磨掉了棱角。
这三种死法我全遇过。所以解法也不玄:/goal 治提前收工,对抗验证治偏心,把活拆给一群干净上下文的子 agent 治跑题。说白了,「检查做对没」这件事被做成了产品功能,人才腾得出手去管方向。
上周我用 dynamic workflow 把自己那个 2022 年的记账后端迁了个底朝天,7600 行 Java 换成 Kotlin,一个工作日干完当晚上线。复盘那天我就有个模糊的感觉:我全程没看几行 diff,盯的是每一道验证门绿没绿。编译要过,老测试要全绿,新老两套代码对同一笔请求吐的 JSON 要一字不差,三道门全开才算放行。Thariq 这句总纲,等于把我那个模糊的感觉钉成了字。
前面几条,都在讲同一件事:把脑子里的东西倒干净
十条里挨着总纲的那几条,拆开看是四个动作:开工前给全量上下文、用几行字的小 spec 让它反过来采访你、让它先出几版 HTML 草样供你挑、用背景信息代替死命令。
捏在一起其实是一句话:你脑子里那些没说出口的东西,才是它跑偏的根源。
「用背景代替死命令」那条,Thariq 举的例子很传神:告诉它这个功能是个实验,一个月后大概率删掉,它就不会给你造一座拆起来肉疼的工程。这跟带人一模一样。你跟实习生只说「不准用这个库」,他换个库照样把架构搭重;你说清楚「这功能活不过下个月」,他自然就写得轻。
这块我算有点底气。我的写作流水线挂着十几个自定义 skill,外加一份越喂越厚的 CLAUDE.md 和一摞 memory,模型每次开工,桌上摆的全是背景。那份写作经验库改到第 73 次了,里面每条规矩都带着「为什么」:光写「禁止破折号」没用,得写清楚它为什么读起来像 AI,模型才会在规则没罩住的角落里做对决策。这套规矩没什么捷径,全是一个晚上一个晚上跟它磨出来的。
但「让它采访我」这条,实话讲我从来没干过。我一直是把需求自己憋到自认为完整,再一股脑丢过去。让它拿着三行的糙 spec 反过来问我实现细节,问出来的盲点大概率比我自己闷头想的全。这条我记下了,内容工厂下一个功能就这么开工。
后面几条,是把「检查」这活儿真的交出去
方向定了以后,Thariq 的打法是给明确目标加验证方法,然后让工具接手。/goal 钉住目标,不让它提前宣布胜利。Workflows 把任务摊给一群并行的子 agent,互相验证,最后吐一份报告:实现了什么,哪里跟计划不一样。
他甚至给了一句可以直接抄的组合指令,意思是「设个目标把 spec 完整实现,用 workflow 验证计划里的每一项,差异写进报告」。
这套我上周刚亲身滚过一遍。迁移那天,翻译 agent 们分六批把 Java 改写成 Kotlin,另一拨对抗校验 agent 在后面挨个挑刺。有个叫 isLiability 的字段在改写时悄悄丢了,就是校验那关捞回来的。要我自己肉眼读 7600 行 diff,这个 bug 八成混过去了。所以「让 AI 验 AI」这件事,我不光信,我还吃过它的红利。
官方还摆了个更吓人的参照:Bun 用这套 workflow 把整个项目从 Zig 移植到 Rust,七十五万行,每个文件配两个 reviewer agent,十一天从第一个 commit 走到 merge,原有测试 99.8% 通过。这种规模的活,放一年前就是「别想了」三个字。
不过得坦白:/goal 这个命令我到现在还没用顺。小活用它像高射炮打蚊子,大活我又习惯自己搭验证门。但它治的「干一半宣布完工」恰好是我被坑最多的死法,下回再有迁移级别的大活,我会把它挂上一起跑。
说到底,检查这活儿没有消失,它是被做成了功能。你不把它交出去,就永远腾不出手当那个管方向的人。
最后一条最撩人,也最贵
十条的收尾是劝你野:把那些你认定 LLM 干不了的活,丢给 Claude Fable 5 试试。它能连着跑几个小时,自己写测试自己验,产出的代码质量经常比手搓的还好。
我信这话,但我想补一个官方没说的注脚:野心是要花钱的。Fable 5 在 Max 套餐里烧额度的速度是 Opus 的两倍,6 月 22 号之前免费随便造,过了这村就得排预算。
我现在让 agent 干正经活之前都会下意识过一遍秤:这活值不值得动用大家伙,杂活就手动切到便宜模型省着点。免费窗口里我把 7600 行的迁移丢了进去,爽是真爽。窗口一关,每一次「野」都是账单上的一行。
还有半个注脚:野心得配验证。没有验证门的野心不叫放权,叫放飞。Thariq 那十条的顺序其实就是答案:先把上下文倒干净,再把验证交出去,最后才轮到野。跳着学,学的是事故。

对照完,我给自己记了两笔账
在用的那一半:全量上下文、背景代替命令、让 AI 验 AI。这些在我的流水线里早就长着,对照下来像批改作业拿了几个勾,心里还挺受用。
欠着的那一半:spec 反向采访、多方向草样、/goal。每一条都不难,难的是改掉「自己憋完再丢」的老习惯。
回头再看开头那句总纲。我之前以为自己已经站在「管方向」那边了,对照完才发现,手还时不时伸回质检台。岗位是新的,肌肉记忆是旧的。
如果十条里只让你今天就试一条,我推这个:把下一个需求写成三行糙 spec 丢给 Claude,让它来采访你。哪一问把你问住了,哪里就是你没想清楚的地方。
你现在盯 AI 干活,盯的是它改的每一行,还是它在不在跑对方向?评论区聊聊,我想看看有多少人跟我一样,手还停在质检台上。