飞飞的AI实验室

用AI放大灵感,把想法变成作品。

cover

React 用了 13 年,积累了 24 万 Star。Linux 内核用了 40 年,Star 数还没追上。

而一只”龙虾”,只用了 3 个月。

2026 年 3 月,OpenClaw 的 GitHub Star 数登顶历史第一,超越了 React、Linux、TensorFlow 这些已经成为行业基石的项目。更魔幻的是,它不是某个大厂的战略级产品发布,而是一个奥地利退休程序员的”周末项目”。

在 OpenAI、Google、Anthropic 这些巨头用几十亿美金筑起护城河的时代,一个个人开发者凭什么能撕开一道口子?

答案藏在一个很简单的道理里:大厂在比谁更聪明,但用户只想要一个能干活的助手。

巨头们的困局:被自己的成功困住了

先说一个事实:ChatGPT 诞生快 4 年了,大多数人的使用方式还是打开聊天框,问一个问题,等一个回答。

不是模型不够强。GPT-4、Claude Opus、Gemini Ultra,推理能力一个比一个强。但它们都被关在同一个笼子里——对话框

你让 ChatGPT 帮你整理邮件,它给你一篇教程。你让 Claude 帮你安排日程,它输出一段建议。你让 Gemini 帮你分析竞品,它给你一份报告的文字稿。

阅读全文 »

cover

你每天花多少时间在”重复劳动”上?

整理邮件、回复消息、安排日程、搜集资料、处理文档……这些事情占据了我们大量时间,却几乎不需要创造力。你可能用过 ChatGPT、Claude、豆包,但它们本质上都是”你问一句,它答一句”的对话工具。你不问,它就坐着发呆。

但 2026 年初,一只”龙虾”彻底改变了这个局面。

它叫 OpenClaw,一个开源的 AI Agent 项目。短短几周,GitHub Star 数飙到 24 万,Mac Mini 因为它直接卖断货,英伟达 CEO 黄仁勋在 GTC 2026 上公开喊话:”OpenClaw 可能是有史以来最重要的软件发布。”

这只龙虾到底有什么魔力?普通人真的能用它拥有一个 24 小时在线的免费私人助理吗?今天我们就来好好聊聊。

ChatGPT 是”嘴”,OpenClaw 是”手”

先搞清楚一个核心问题:OpenClaw 和 ChatGPT 到底有什么区别?

一句话概括:ChatGPT 是对话工具,OpenClaw 是执行框架。前者给你答案,后者帮你干活。

你让 ChatGPT 帮你整理邮件,它会告诉你”可以按优先级分类,先处理紧急的……”。听起来很有道理,但邮件还在收件箱里躺着,一封都没动。

阅读全文 »

cover

上周在终端里敲命令时,突然想:要是能直接在命令行里问 AI 该多好。搜了一圈,发现 Google 推出了 Gemini CLI,一个开源的命令行 AI 助手。装上试了试,确实好用。今天把我踩过的坑和使用心得整理出来,写一篇保姆级教程。

Gemini CLI 是什么

Gemini CLI 是 Google 推出的开源 AI 命令行工具,让你可以直接在终端里使用 Gemini 模型。

它不是简单的”问答机器人”,而是一个真正的 AI 代理(Agent)。它能:

  • 读写本地文件
  • 执行 shell 命令
  • 搜索网页内容
  • 理解和生成代码
  • 多步骤推理和规划

想象一下这些场景:

  • 你在看一个陌生项目的代码,直接问”这个函数是干什么的”
  • 你忘了某个 git 命令,问”怎么撤销上一次提交”
  • 你要写个脚本,说”帮我写个批量重命名文件的脚本”

这些 Gemini CLI 都能搞定。

为什么要用 Gemini CLI

阅读全文 »

cover

上周在用 Claude Code 重构一个老项目时,我犯了个错误:直接让 Claude 开始改代码,结果它改了十几个文件,测试全挂了。回滚之后,我换了个方式——先让它进入 Plan 模式,把整个重构方案写成文档,我审核通过后再执行。这次一次成功。

这让我意识到,AI 编程工具最大的问题不是写不出代码,而是”想都不想就开始干”。

Plan 模式解决什么问题

传统的 AI 编程助手(包括 Claude Code 的默认模式)工作方式是:你说一句话,它立刻开始改代码。这在处理简单任务时没问题,但遇到复杂场景就容易翻车。

想象一下这个场景:你让 Claude 给 API 添加分页功能。它可能会:

  • 修改路由处理函数
  • 更新数据库查询
  • 调整返回格式
  • 修改前端调用代码

如果它对现有架构理解有偏差,可能会破坏现有的缓存层,或者忽略了 ORM 的约定,或者重复实现了已有的工具函数。等你发现问题时,已经改了一堆文件。

Plan 模式的核心思路是:把”思考”和”执行”分开

在 Plan 模式下,Claude 只能读代码、搜索文件、查资料,但不能修改任何东西。它会先写一份详细的实施计划,你审核通过后,它才开始真正动手。

阅读全文 »

cover

最近在和几个做 AI 应用的朋友聊天时,发现一个有意思的现象:有人用 Claude Code 写代码写得飞起,有人却更喜欢在 Dify 上拖拽节点搭建工作流。这两个工具看起来都在做”AI 开发”这件事,但用起来感觉完全不一样。

这让我开始思考:为什么会有这么大的差异?它们到底在解决什么问题?

两个工具,两种思路

Claude Code Skills:给 AI 装上工具箱

Claude Code 本质上是一个终端原生的 AI 编程助手。它不是简单的代码补全工具,而是能够理解你的整个项目、跨多个文件进行修改、运行测试、甚至帮你提交代码的”AI 结对编程伙伴”。

Skills 是 Claude Code 的核心扩展机制。你可以把它理解为给 Claude 装上了一个工具箱——每个 Skill 就是一个专门的能力模块。

比如说,你可以创建一个 /deploy Skill,教会 Claude 如何部署你的应用:

1
2
3
4
5
6
7
8
9
10
---
name: deploy
description: Deploy the application to production
disable-model-invocation: true
---

Deploy steps:
1. Run test suite
2. Build the application
3. Push to deployment target

这个 Skill 文件放在 .claude/skills/deploy/SKILL.md 后,你只需要在终端输入 /deploy,Claude 就会按照这个流程帮你完成部署。

阅读全文 »

cover

你每天产生多少条笔记?

会议纪要、灵感碎片、待办事项、读书摘录……这些东西散落在各个 App 里,找起来要命。你明明记了一条重要笔记,但就是不记得存在哪个笔记本里了。

现在,你可以对你的 OpenClaw 说一句:**”帮我找一下上周关于项目排期的笔记”**。

几秒钟后,它把笔记标题、摘要、修改时间整理好了,问你要不要看正文。

这就是 ima-skills——一个把 IMA 笔记和 OpenClaw 打通的 Skill。今天这篇文章,教你怎么安装、配置,以及怎么玩出花来。

先搞清楚:OpenClaw 的 Skills 是什么?

如果你刚接触 OpenClaw,可能对 Skills 这个概念还不太熟。

Skills 是 OpenClaw 的”技能插件”。 每个 Skill 就是一个 Markdown 文件(SKILL.md),里面写了 AI 应该怎么执行某类任务——调用什么 API、传什么参数、返回什么结果。

打个比方:OpenClaw 本身就像一个聪明但什么都不会的新员工。Skills 就是你给它的”操作手册”——装了 Gmail Skill,它就会处理邮件;装了 Obsidian Skill,它就会管理你的知识库;装了 ima-skills,它就会操作你的 IMA 笔记。

阅读全文 »

cover

你打开 Android Studio,看到一条升级提示:AGP 9.0 可用

你手一抖点了升级。

然后你的项目爆了 47 个编译错误。BaseExtension 找不到了,applicationVariants 不能用了,Kotlin 插件冲突了,Hilt 不兼容了……

你花了整整一天才把项目跑起来。

恭喜你,你刚刚体验了 Android 开发史上最大的一次构建系统重构。

Reddit 上有人发帖说:**”AGP 9.0 发布了,简直是灾难。这是我的完整迁移指南,希望你不用受这个罪。”** 帖子下面一片惨叫。

但冷静下来看,AGP 9.0 确实是 Google 这几年来做的最重要的一次底层升级。痛,但有意义。

AGP 9.0 到底改了什么?

一句话总结:Google 把积攒了好几个大版本的”技术债”一次性清掉了。

阅读全文 »

cover

上周一个朋友跟我吐槽。

他看了我之前写的 OpenClaw 教程,兴冲冲地装了一套。配好了 WhatsApp,接上了 API Key,准备体验传说中的”AI 贾维斯”。

但他为了省钱,选了最便宜的模型——Haiku。

结果呢?让它帮忙写个 Python 脚本,写出来的代码跑不通。让它改 Bug,越改越多。让它分析一个文件,它幻觉出了三个不存在的函数。最后他花了两个小时”教”AI 做一件本来 20 分钟就能搞定的事。

他跟我说:”这玩意儿就像我招了个实习生,还是那种上班第一天就敢重构你代码的实习生。”

我说:不是工具的问题,是你给它装了个笨脑子。

OpenClaw 是什么?30 秒搞清楚

如果你还不了解 OpenClaw,先快速补课。

OpenClaw 是 2026 年最火的开源 AI 项目——GitHub 上超过 25 万颗 Star,打破了 React 保持了十年的增长纪录。它的创始人是奥地利开发者 Peter Steinberger(PSPDFKit 的创始人),原名叫 “Clawdbot”,因为 Anthropic 的商标投诉改了两次名,最终定名 OpenClaw。

阅读全文 »

cover

想象一个场景。

你正在开会,突然想起今晚得加班,来不及做饭。你掏出手机,对着 Gemini 说了一句:”帮我在 Uber Eats 上点一份辣鸡肉三明治。”

然后你把手机放下,继续开会。

几秒钟后,你的手机自己打开了 Uber Eats,搜索附近的餐厅,找到了 Popeye’s,点进去,选好了辣鸡肉三明治,加到购物车,然后通知你:”已经准备好了,请确认下单。”

你全程没有碰过屏幕。

这不是科幻电影。这是 Google 在 2026 年 3 月刚刚上线的 Gemini Screen Automation——一个让 AI 直接操控你手机上的 App 来完成任务的功能。

这到底是个什么东西?

简单说:Gemini 现在可以替你操作手机了。

不是回答问题,不是推荐餐厅,不是给你一个链接让你自己去点——而是真的打开 App、浏览菜单、选择商品、添加到购物车。像一个隐形的助手坐在你旁边,替你完成那些需要十几次点击才能搞定的重复操作。

阅读全文 »

cover

你花了三天写完一个功能,信心满满地提交了 PR。

然后你的 Tech Lead 留了 47 条评论。

变量命名不规范、边界条件没处理、这段逻辑有竞态风险、那个 SQL 查询可以优化、错误处理不够健壮、单元测试覆盖率不够……

你看着那一片红色的评论气泡,心态崩了。不是代码写得太差,是你在提交之前,没有人帮你”过一遍”。

但现在有了。

2026 年 3 月 9 日,Anthropic 正式发布了 Claude Code Review——一个多 Agent 系统,专门在你提交 PR 的时候帮你做深度代码审查。更重要的是,就算你用不了企业版,你也可以用 Claude Code 在本地做一次”自检”,把那 47 条评论在提交之前就消灭掉。

Claude Code Review 到底是什么?

简单说:它是一个 AI 代码审查团队。

不是一个模型看一遍你的代码,而是一个多 Agent 系统——多个 AI Agent 同时工作,每个 Agent 负责审查你代码的不同方面。

阅读全文 »
0%