飞飞的AI实验室

用AI放大灵感,把想法变成作品。

上周接手了一个同事离职留下的项目。Python 后端,三万多行代码,分布在 60 多个文件里。

README 写了半页,最近一次更新是去年 8 月。设计文档在飞书的某个不知道哪层的文件夹里,打开一看,跟现在的代码已经对不上了。Slack 里倒是有一些讨论记录,但散落在三四个频道里,搜半天搜不出完整的决策链。

我花了两天时间,才把核心模块之间的调用关系理清楚。两天。

后来在 GitHub Trending 上刷到了 Graphify,10 天涨了 2 万多星。我以为又是一个 demo 级的项目,随手点进去看了看,结果试了一下就没停下来。

它解决的是一个真实的痛

复杂项目最头疼的地方,往往不在代码本身——代码再烂,花时间总能读懂。真正要命的是知识碎片化。

代码在 GitHub,设计文档在 Notion 或飞书,技术讨论在 Slack 或微信群,架构图在某个 Draw.io 文件里,上次技术评审的录屏不知道存哪了。每种信息用不同的格式存在不同的地方,想搞清楚一个模块为什么这么设计,你得同时打开四五个工具来回跳。

新人接手项目要拼图。就算是自己写的代码,两周不看也要拼图。

Graphify 干的事情说起来很简单:你给它指一个目录,它把里面的代码、文档、PDF、图片、甚至视频全部吃进去,然后吐出一张可交互的知识图谱。代码里的函数调用关系、模块依赖、文档里提到的概念、讨论中出现的设计决策——全部变成图上的节点和边。

我实际跑了一下

阅读全文 »

cover

大家好,我是飞飞。

上周我做了一件蠢事。

我让 Claude 帮我整理两个月前读过的一篇 Transformer 架构分析文章——然后我意识到,我根本找不到那篇文章了。收藏夹里有,Obsidian 里也剪进去了,但那篇文章写了什么,它和我后来读的三篇相关论文有什么联系,我完全不知道。我只记得”当时觉得很有意思”。

然后 Karpathy 发了一个 GitHub Gist,把这件事说得非常清楚:我的问题不是缺工具,是缺一个能把知识”编译”起来的机制。

RAG 那条路走不通

在 Karpathy 的 Gist 里,他开头就把问题说明白了。当前大多数人用 LLM 处理文档的方式是 RAG——把文件上传,问问题的时候 LLM 去检索相关段落,拼出答案。NotebookLM、ChatGPT 文件上传、大多数向量数据库方案,都是这套逻辑。

他说的那句话我觉得戳到了很多人:”Ask a subtle question that requires synthesizing five documents, and the LLM has to find and piece together the relevant fragments every time. Nothing is built up.”

翻译一下就是:你问了一百次,知识库里的知识还是零。每次查询都是从头开始的一次性劳动。

我对着这句话想了一下自己的 Obsidian。里面塞了两年多的内容,一千多个笔记,但每次我需要综合五篇文章来回答一个问题,我还是要自己翻出来、自己读、自己归纳。工具帮我”存了”,但没帮我”理解过”。

阅读全文 »

cover

大家好,我是飞飞。

上周五晚上我刷到朋友发的一张截图,标题四个字:”送钱者 ATM-er”,下面是一段描述:

“恭喜您,您竟然测出了这个世界上最稀有的人格。是的,ATM-er 不一定真的’送钱’,但可能永远在’支付’。支付时间、支付精力、支付耐心、支付一个本该安宁的夜晚。因此像一部老旧但坚固的 ATM 机,插进去的是别人的焦虑和麻烦,吐出来的是’没事,有我’的安心保证。”

我把手机屏幕又凑近看了一遍。

然后放下手机去测了一下,结果也是 ATM-er。

这个叫 SBTI 的测试是 4 月 9 日突然冲上热搜的,全名 Silly Big Personality Test(傻了吧唧人格测试),由一个 B 站 UP 主”蛆肉儿串儿”创作,最初是为了劝一个爱喝酒的朋友戒酒,一不小心走红。它有 27 种人格类型:DEAD(死者)、MALO(吗喽)、SHIT(愤世者)、FAKE(伪人)——每一种都是这种画风。服务器当天被挤崩了,大家靠截图”云体验”。

我的 MBTI 是 ISFJ。测了大概五年了,自我介绍说”我是守护者型”的时候我从来不觉得有什么问题。

SBTI 出来,测出 ATM-er,我突然想问:这两个东西说的是同一个人吗?

MBTI 告诉你的那个你

阅读全文 »

cover

大家好,我是飞飞。

周四下午三点多,我趴在工位上刷 Claude Code 插件目录,想找点新玩具。superpowers 已经装一周了,我开始好奇一个问题:Claude Code 的 subagent 机制除了用来跑工作流之外,能不能干脆把一整个团队都塞进来?

然后我就在 Reddit 一个帖子里看到了 agency-agents。

帖子作者 msitarzewski 只写了一句话:”我决定把一个完整的 AI 代理公司塞进 Claude Code。” 下面贴了个 GitHub 链接。我点进去 README 的第一眼,不是”这是一个 skill 库”,而是”Engineering Division (27 agents), Design Division (8 agents), Marketing Division (29 agents)…”——每一个 Division 下面挂着几十个 markdown 文件,每个文件是一个岗位。

我数了一下分部,十个。我又数了一下 agent 总数,100 出头。

这个规模已经不像一个 Claude Code 插件了,更像一间公司的组织架构图。

它到底往 Claude Code 里塞了什么

agency-agents 的安装和 superpowers 一样简单——你 clone 下来然后跑一句:

1
./scripts/install.sh --tool claude-code
阅读全文 »

cover

大家好,我是飞飞。

上周三晚上十一点半,我在 Claude Code 里敲了一句:”帮我给博客加个标签云组件,点了能筛选文章那种。” Enter 按下去大概十秒,屏幕上弹出来一行字——

“开始之前我想确认一下你这个标签云的用户路径:用户是更常在首页找热门标签,还是更常从单篇文章底部跳到同标签列表?”

我的左手小指还搭在 Enter 键上没松开,右手伸向鼠标想把这行字划掉重说,又缩回来——因为几个小时前,同一台电脑同一个 Claude,我让它改个 CSS 样式它已经啪啪写三十行代码怼过来了。几小时中间我只做了一件事:装了 superpowers。

于是我把伸向鼠标的手收回来,开始认真回答它那个用户路径的问题。

它到底是什么

先给还没听过这东西的朋友交个底。

superpowers 是 Jesse Vincent(Keyboardio 创始人、Prime Radiant 的人)在 2025 年 10 月 9 日开源的一个 Claude Code 插件。那天有意思:Anthropic 早上刚刚上线了 Claude Code 的 plugin 系统,Jesse 下午就把自己过去两周偷偷攒的工作流打包扔到了 marketplace。他自己在博客里写:”本来还想再打磨几周,结果 Anthropic 这波催得我必须发。”

装它一共两条命令:

阅读全文 »

cover

大家好,我是飞飞。

上周五晚上十一点多,我准备关电脑睡觉,刷到那条热搜的时候手指停了两秒。

“夫妻用AI写公众号年赚200万”——下一行就是账号被封。深圳一对90后夫妻,六六和七哥,公众号”爆了么AI”在4月1日被微信封禁,理由是”存在非真人自动化创作行为”。

我没觉得大快人心,反而坐直了身子。因为我自己也在用AI辅助写作——这篇文章的大纲就是Claude帮我梳理的。这次封禁到底划在哪一刀上?AI 本身?还是我这种用法?我得把这事搞清楚。

200万收入的真相:真正赚钱的从来不是写文章

先算一下这笔 200 万是怎么来的。

他们搭了一套叫”爆了么”的智能创作系统:对标爆款文章、拆关键词、AI 生成、简单人工审核,3 分钟出一篇。单篇 10 万+阅读能带来 300 多块流量收入,据说最高一篇 130 万阅读赚了 6000 多。

听起来很美,但我算了下账:就算他们一年发 500 篇,每篇都是 10 万+(这已经是神仙发挥),自营账号的流量收入顶多也就 40 到 50 万。剩下 150 多万从哪来的?

答案是保证金。

阅读全文 »

cover

哈喽,我是飞飞。

上个周末,我盯着账单坐了好一会儿。

这个月光 Claude API 和 OpenAI 的调用费,加起来比我预想的多不少。我已经刻意克制了——不跑没必要的任务,能用免费额度就不动 API。但账单还是比上个月涨了。

我就想:能不能搭一套完全不烧钱的本地 AI 开发环境?

然后我花了半小时,用 Ollama + Claude Code + gemma4:e4b,把一个计算器跑起来了。

本地AI开发流程

为什么选 Ollama

我之前用过 LM Studio,界面好看,但总感觉太「重」。

Ollama 的设计哲学更接近 Docker——一个命令拉模型,一个命令跑起来,REST API 直接暴露在 11434 端口。你甚至不需要打开任何 UI。

阅读全文 »

cover

大家好,我是飞飞。

上周五晚上,我在刷 Anthropic 账单的时候发现,4月份头一篇文章跑完整条流水线,直接吃掉了 19% 的月度额度。

我用的是 Max 计划,$100/月。就是说,写这一篇博文花了我 $19。

我当时的第一反应不是”啊这也行”,是真的有点坐不住——上个月刚因为订阅这个计划跟自己较劲了半天,结果第一篇就烧这么多?

我有一条 6 个 Skill 的写作流水线

我搭了一套 Claude Code 的博客创作流水线,从找资料到发布,基本是全自动的:

1
2
content-researcher → content-writer → content-polisher
→ content-training → content-artist → content-distributor

skill-pipeline

每个 Skill 做一件事:researcher 负责搜资料,writer 写文章,polisher 打磨语言,training 记录改进经验,artist 生成封面图,distributor 分发到各个平台。

阅读全文 »

cover

哈喽,我是飞飞。

上周我在想一个问题,卡了大概两分钟,然后下意识地打开了 Claude。

答案一下子就出来了。然后我合上窗口,发现我完全说不清楚那个答案为什么是对的。

这个感觉有点奇怪。

我最近看到一项 MIT 的研究,看完心里有点不是滋味。他们给一群大学生戴上脑电图设备,分三组:一组用 ChatGPT 写文章,一组用搜索引擎,一组什么工具都不用、全靠自己想。

结论很直接:用 ChatGPT 那组,大脑活跃度最低、神经连接最少、记忆提取能力最差。

更绝的是,越写越懒。第一篇还有点自己的东西,到第三篇基本就在复制粘贴了。

「认知卸载」:你以为在省力,其实在亏本

这个现象有个学术名词,叫认知卸载(Cognitive Offloading)——把本该大脑干的活,外包给了工具。

阅读全文 »

cover

哈喽,我是飞飞。

今天聊一个我最近最想分享的事 —— 自从我订阅了 Claude Code,我的整个工作方式都变了。

不是那种”多了个好用的工具”的变,是那种”等等,原来事情可以这样做?”的变。上周有个需求,以前我估摸着要写一天,结果一个半小时搞定了,还包括测试。当时坐在椅子上愣了一下,觉得有点不真实。

这段时间我用 Claude Code 做了不少事情——写代码、看源码学新东西、给自己搭了一套写文章的自动化流水线。下面挑重点说说。

先说订阅这件事

我之前也折腾过不少 AI 编程工具。Copilot 用了很久,Cursor 也试过一阵子。说实话它们都能用,但总觉得差了点什么。

Copilot 最大的问题是它只看得到当前文件。你在写一个组件,它帮你补全这个组件的代码还行,但它根本不理解你整个项目的架构。改了接口它不知道要同步改类型定义,修了个 bug 它不知道同一个逻辑在三个地方都要改。

Claude Code 不一样。它是 Anthropic 官方出的,一个完全运行在终端里的 AI 编程 Agent。注意,不是”编程工具”,是 Agent。它能读你整个代码仓库,理解项目结构,自己执行命令,自己跑测试,自己提交代码。

Anthropic 自己有个数据,他们工程师写的代码里 90% 是 Claude Code 完成的。我一开始觉得这个数字有点夸张,用了一阵之后觉得 —— 说不定真没夸张。

阅读全文 »
0%