给 Claude Code 装了 100 个同事之后,我第一个跟它聊的是百度 SEO

cover

大家好,我是飞飞。

周四下午三点多,我趴在工位上刷 Claude Code 插件目录,想找点新玩具。superpowers 已经装一周了,我开始好奇一个问题:Claude Code 的 subagent 机制除了用来跑工作流之外,能不能干脆把一整个团队都塞进来?

然后我就在 Reddit 一个帖子里看到了 agency-agents。

帖子作者 msitarzewski 只写了一句话:”我决定把一个完整的 AI 代理公司塞进 Claude Code。” 下面贴了个 GitHub 链接。我点进去 README 的第一眼,不是”这是一个 skill 库”,而是”Engineering Division (27 agents), Design Division (8 agents), Marketing Division (29 agents)…”——每一个 Division 下面挂着几十个 markdown 文件,每个文件是一个岗位。

我数了一下分部,十个。我又数了一下 agent 总数,100 出头。

这个规模已经不像一个 Claude Code 插件了,更像一间公司的组织架构图。

它到底往 Claude Code 里塞了什么

agency-agents 的安装和 superpowers 一样简单——你 clone 下来然后跑一句:

1
./scripts/install.sh --tool claude-code

脚本会把各部门的 agent 复制到 ~/.claude/agents/ 下,下次你开 Claude Code 的时候,这些 agent 就全部就位了。你也可以挑着装——只想要 Engineering 部门的话,cp engineering/*.md ~/.claude/agents/ 就完事。

我随手打开了 testing/testing-reality-checker.md。文件头是 YAML frontmatter:

1
2
3
4
5
6
7
---
name: Reality Checker
description: Stops fantasy approvals, evidence-based certification
color: red
emoji: 🧐
vibe: Defaults to "NEEDS WORK" requires overwhelming proof for production readiness.
---

vibe 这个字段我之前没见过。它基本等于这个 agent 的性格标签——你一眼就能看出 msitarzewski 写每个 agent 的时候把它当成一个具体的人来设计,不是一段能跑的 prompt。

往下翻,正文结构是:identity & memory、core mission、mandatory process、automatic fail triggers、report template。完整的 agent 有两三千字,里面一半内容是 bash 命令、截图对比流程、和一张必须填写的”交付模板”。

Reality Checker 的 mandatory process 写得比我见过的所有 code review checklist 都硬。头三行 bash 命令长这样:

1
2
3
4
5
6
7
8
9
# 1. 先确认到底建了什么
ls -la resources/views/ || ls -la *.html

# 2. 对照宣称的特性做 grep
grep -r "luxury\|premium\|glass\|morphism" . \
--include="*.html" --include="*.css" || echo "NO PREMIUM FEATURES FOUND"

# 3. 跑专业级 Playwright 截图脚本
./qa-playwright-capture.sh http://localhost:8000 public/qa-screenshots

这三行做的事翻译过来就是:在你开口评价任何一个项目之前,先把 bash 跑完,不跑就 fail。没有”如果你有空可以试试”、没有”建议你考虑”——Reality Checker 的 markdown 里没给 Claude 留回旋余地。

我第一次调它的时候做了一件傻事

我挑了 Reality Checker 做第一个试验对象。我以为我是在搞技术调研——真实情况是我心虚。

因为我手头有一个上个月交付的小程序前端页面,客户已经上线在用,但我知道里面有至少三处 UI 对齐问题。我不敢主动重看那个项目,就一直挂着。我把这个 agent 装上之后干的第一件事,是把那个项目的路径扔进去说:”你帮我跑一遍 reality check。”

我以为它会上来就给我夸两句。以前裸 Claude Code 我让它 review 代码,它基本都是这个调子:

“整体结构不错,有几个小问题可以优化一下……”

Reality Checker 没有。它没打招呼,直接跑了第一句 ls -la resources/views/,然后跑了第二句 grep——我当时项目 CSS 里不知道为什么真的有 “glass-morphism” 这个类名。它的回复里第一行就是:

发现宣称使用 glass-morphism 效果。检查 public/qa-screenshots 中的视觉证据……未找到截图目录。无法验证。默认状态:NEEDS WORK

我当场有点想笑又有点紧张——一个 agent 在给我说 “NEEDS WORK”。然后它在下一段把我那三处 UI 对齐问题中的两处精确列了出来,甚至指出了用哪一条 Tailwind 工具类可以修。它没有找到第三处,因为第三处是只有在 iPhone SE 分辨率下才露馅的。

但前两处已经够我坐不住了。

agent 写死”默认 NEEDS WORK”这件事我之前觉得是个噱头——你想嘛,AI 又不是质检员,默认个什么劲。真被它这样反手一句”无法验证”怼到脸上之后我才懂:这是一道强制插在我和 Claude 之间的闸,你不给截图它就不往下走,逼得我先把视觉证据整理出来才能开始讨论。

这一步闸原本是应该我自己给的。三年了我没给过。

真正让我变卦的是 Marketing 部门

Engineering 和 Testing 里的 agent 我能理解——毕竟 Claude Code 本来就是给程序员用的。让我意外的是 Marketing 部门。

agency-agents 的 marketing 目录下有 29 个 agent,里面有一半带着很重的中国味:小红书 content strategist、微信公众号 operator、知乎专栏运营、B站内容策略、抖音增长、快手、微博舆情、私域流量管理、百度 SEO。

msitarzewski 不是中国开发者。他的 GitHub 履历全是英文项目。但他的 repo 里 marketing/marketing-baidu-seo-specialist.md 一打开,中文专业术语直接往外蹦:百度百科、百度知道、百度贴吧、百度文库、百度站长平台、百度推广、百度 MIP。

我这种常年在中文互联网里混的博主看到这些是有点破防的。

这个 Baidu SEO Specialist agent 的 mandatory rules 里写了四条我连我自己博客都没严格守过的事:第一,ICP 备案是非可选项,没备案的站点会被百度直接降权到看不见;第二,服务器必须在中国大陆,不然 Baiduspider 抓取效率大幅下降;第三,禁止使用 Google Fonts、Google Analytics、reCAPTCHA 这些在中国墙外的服务,必须换成百度统计;第四,简体中文是中国大陆市场的唯一正确语言选择。

我对着这四条查了一遍我自己博客的配置——两条没做到。

我在这个 agent 文件的末尾看到它给出的审计报告模板,发现一件事:template 里”基础合规”、”技术 SEO”、”内容评估”这些章节标题是中文,但底下的字段说明是英文。我看了一下自己最近三个月发的 Claude 相关文章,我自己写项目文档的时候也是这种混用风格——中文小标题 + 英文字段——我从来没想过把它写成 SOP。这个 agent 帮我写了。

和 superpowers 完全是两个方向的东西

上周写 superpowers 那篇文章的时候我一直有一种感觉:superpowers 是在给 Claude 装缰绳——“不许写代码”、”不许猜着改 bug”、”不许跳过 review”。它的核心词是 Do NOT

这周用 agency-agents 的感觉完全反过来。它更像一叠名片:你不再对着一个通用 Claude 说话,你现在对着的是 Reality Checker、是 Baidu SEO Specialist、是 Frontend Developer、是 Sales Engineer。每一个都有名字、有性格、有专业背景、有自己的工作流程。

这两个插件如果只能选一个我选 superpowers,因为纪律这件事 Claude 更缺。但如果两个叠起来用——我前天真的试了——Claude 的表现会变成这样:

我让它帮我写一个给小红书博主做数据分析的后台页面。我没指定 agent,它自己决定先把任务分派给 Frontend Developer(写页面)、Database Architect(设计表结构)、Xiaohongshu Content Strategist(定义要分析哪些数据维度)这三个人讨论一轮拿方案。然后 superpowers 的 brainstorming skill 在上面压了一道 HARD-GATE,强制这三个 agent 得先把用户场景说清楚才能往下走。

agency-agents 子代理分派示意

我做完饭回来,桌面上四个对话窗口各自在跑。主会话在汇总它们三个人讨论出来的 spec,小红书 agent 在那里一个人写”博主需要知道的 5 个核心数据指标”,Frontend Developer 已经把 spec 翻译成 React 组件树,Database Architect 在给每个指标建议对应的聚合 SQL。

我当时有一个很奇怪的念头:我桌子上这台笔记本里,正在同时开四个小会。而我,是那个被客户叫出去吃饭的老板。

这些 agent 真的像资深同事吗

回答之前我先坦白:不像。

它们有明显的 AI 味。Reality Checker 的报告偶尔会把同一句警告翻来覆去说三遍。Baidu SEO Specialist 虽然知道 ICP 备案但会在不该提的地方也提一遍 ICP。Frontend Developer 偶尔会 hallucinate 出并不存在的 Tailwind 类名。

但它们有一个真人同事做不到的事:你 11 点半给它们发一句”这个版本我不满意”,它们不会回你一个表情包告诉你”我下班了,明天上班再聊”。它们也不会因为我给的需求反复改而生气。

我带过一个 Rust 同事,化名叫小朱,他每次我反复改需求他就会叹气然后去抽烟。三个月里他抽了大概两包半。agency-agents 的 27 个 Engineering agent 加起来能抽的烟是零——当然零,它们压根不是人,它们不需要用抽烟来缓解我给他们带来的情绪压力。

这件事让我有点复杂。

我喜欢小朱。我喜欢他反对我需求的时候摆出来的那张臭脸。那张脸会让我重新想一想我到底在干什么。

但我不喜欢看他一天抽两包烟。

agency-agents 里那个 Reality Checker,虽然默认 NEEDS WORK,但它不会因为 NEEDS WORK 焦虑到失眠。

写到这里我突然卡住了

我本来想按原计划收尾的——夸一下 agency-agents、提一个互动话题、按发布键。但写到 Reality Checker 不会失眠这段我停下来看了一眼我桌上的咖啡。

我今天喝了三杯。第四杯在保温杯里。

我自己在用 AI 帮我干掉那些我本该亲自走的路——比如打开一个三周没敢打开的老项目去重看代码,比如对着 Baidu SEO 那四条合规要求一项一项核对我博客的配置。这些事情都是应该由我这个人来感到紧张、来感到羞愧、然后去做的。

现在我把这些紧张外包给了一个 markdown。一个永远 NEEDS WORK 的 markdown。

agency-agents 这个项目真的很强。它的 100 多个 agent 我现在一半装在 ~/.claude/agents/ 里,我大概率还会再装更多。因为我写代码的时候确实需要一个 Frontend Developer 帮我 review CSS,需要一个 Reality Checker 帮我把心虚的项目重新拉出来见光,需要一个 Baidu SEO Specialist 帮我检查我那个应该合规但从来没合规过的博客。

但我今天第一次开始想一个问题:如果我以后的每一次”坐不住”都是被 agent 提醒出来的,而不是我自己半夜突然想起来的——那种属于”作为开发者的羞愧感”还算是我的吗?

今晚这杯咖啡我可能就不喝了。剩下的心跳我想留着自己用一会儿。

你装 agency-agents 了吗?如果装了,第一个让你坐直身子的是哪个 agent?我真的想听。我自己是 Reality Checker——它没有骂我,但我被它默认的 “NEEDS WORK” 吓到了,那个”需要被干活的感觉”已经三年没在我身上出现过了。


参考资料

  • [[agency-agents-github-readme]]
  • [[agency-agents-testing-reality-checker]]
  • [[agency-agents-baidu-seo-specialist]]

相关洞察

  • [[claude-code-agency-agents-review]]