飞飞的AI实验室

用AI放大灵感,把想法变成作品。

cover

装好 OpenClaw 的那个晚上,我兴奋地跟它聊了两个小时。

第二天早上查账单,傻了:100 美元没了。

就聊了两个小时。没有写代码,没有自动化任何东西,就是”你好””你能做什么””帮我搜一下今天的新闻”。100 美元。

这不是个例。社区里有人月账单 3600 美元,有人一觉醒来因为自动化任务死循环多出了四位数。有人打个招呼就用掉 3 万 Token,完成一个简单任务直接顶到 128K 上下文上限。

OpenClaw 免费,但 Token 不免费。

经过一个月的折腾——换模型、调配置、砍 Skill、优化记忆、搭工作流——我终于把它从一个”烧钱聊天机器人”变成了一个真正在干活的 AI 员工。月费稳定在 80 美元左右,每天帮我处理 4-5 个自动化任务。

今天分享这个过程中踩过的所有坑,以及最终让 OpenClaw 真正”干活”的完整方案。

第一课:搞清楚钱花在哪里了

OpenClaw 本身是开源免费的。你花钱买的是三样东西:

阅读全文 »

cover

你对着手机说”帮我在美团上点一份黄焖鸡米饭,不要辣,送到公司”。

然后你放下手机,继续开会。

5 分钟后,外卖下单了。AI 自己打开美团,搜索黄焖鸡,选了评分最高的店,勾掉辣椒选项,确认地址,完成支付。整个过程,你的手指没碰过屏幕一次。

这不是概念视频,是 AutoGLM 已经能做到的事情。

2025 年 12 月 9 日,智谱深夜开源了 AutoGLM——一个能”看懂”手机屏幕、自主规划任务、模拟真人操作的 AI Agent 框架。模型(AutoGLM-Phone-9B)用 MIT 协议开源,代码用 Apache-2.0 协议托管在 GitHub。

这意味着任何硬件厂商、手机厂商、开发者,都可以基于 AutoGLM 造出自己的”AI 手机”。

已经支持微信、淘宝、抖音、美团等超过 50 个高频中文应用。有人用它自动刷抖音,有人用它帮忙比价购物,甚至有人让它玩原神。

今天我们来拆解:AutoGLM 到底怎么做到的?”眼睛+大脑+手”的架构设计有多精妙?它和小米 miclaw、豆包手机有什么本质区别?

传统方案的死胡同

阅读全文 »

cover

你花了两天时间,从零写了一个”帮我每天早上自动搜索新闻、整理成早报、发到群里”的 Agent。代码写了 500 行,调试了十几次,终于跑通了。

然后你发现,ClawHub 上已经有一个现成的 Skill,一行命令安装,五分钟配好,效果比你写的还好。

这种感觉,就像你花了一周手搓了一个轮子,结果隔壁工位的同事说:”npm 上有个包,三行代码搞定。”

2026 年做 AI Agent,最大的杠杆不是写代码,是选 Skill。

截至 3 月,ClawHub 上已经有超过 13,700 个 Skills。Claude Code 的 Skills 系统也从简单的 Markdown 指令进化成了完整的可编程 Agent 平台。两套 Skills 体系,覆盖了从个人自动化到企业办公的几乎所有场景。

今天我们来一次彻底的梳理:Skills 到底是什么?两大平台的 Skills 有什么区别?怎么选?怎么用?怎么自己写?

Skills 到底是什么:给 AI 装技能包

最简单的理解:Skills 就是 Agent 的技能包。

没有 Skills 的 Agent,就像一个聪明但什么工具都没有的人。它能思考、能对话,但做不了具体的事。给它装上”浏览器控制”的 Skill,它就能上网搜索;装上”邮件管理”的 Skill,它就能收发邮件;装上”GitHub”的 Skill,它就能帮你审 PR、管 Issue。

阅读全文 »

cover

你在企业微信群里发一句”帮我把上周的客户反馈整理成表格”,30 秒后,一份结构清晰的智能表格出现在群里。

不是同事做的,是 AI 做的。

3 月 8 日,企业微信官方向企业管理员推送了一条消息:**”只需 3 步,快速将 OpenClaw 接入智能机器人。”**

这不是第三方 hack,是官方支持。企业微信正式开放了 OpenClaw 的接入能力——不需要公网 IP,不需要域名,不需要复杂的服务器配置。长连接模式,本地电脑就能跑。

更炸裂的是,它不只是”聊天”。OpenClaw 可以通过 Webhook 协议直接向企业微信的智能表格写入数据,还能调用企微的文档 API、日程 API、通讯录 API。AI 从”回答问题”变成了”帮你干活”。

腾讯云 Lighthouse、Kimi、MiniMax、Coze 扣子、百度智能云、华为云……各大平台已经陆续上线企微接入方案。一个新的生态正在形成。

为什么企业微信 + OpenClaw 是最佳搭档

OpenClaw 能接入很多 IM——飞书、钉钉、Slack、Telegram、Discord。为什么企业微信的接入特别值得说?

第一,企业微信连着个人微信。

阅读全文 »

cover

你让 OpenClaw 帮你订机票、查天气、设闹钟,它都能做。但有一个前提——你得坐在电脑前。

这就尴尬了。我们一天 80% 的数字生活发生在手机上。聊天在手机上,打车在手机上,点外卖在手机上,控制家里的灯和空调也在手机上。AI Agent 再强大,如果只能待在电脑里,它就永远只是一个”工位助手”,而不是一个”生活助手”。

3 月 6 日,小米悄悄做了一件事:没有发布会,没有 PPT,直接开启了 Xiaomi miclaw 的小范围封测。

雷军在微博上只发了四个字:手机龙虾。

这是国内第一个手机端的类 OpenClaw AI Agent。它不是小爱同学的升级版,而是一个全新物种——能理解你的意图、自主拆解任务、调用 50 多个系统工具、联动整个米家生态的移动端智能体。

不是聊天机器人,是”能干活”的手机 Agent

先搞清楚一个概念:Xiaomi miclaw 和小爱同学完全不是一回事。

小爱同学是语音助手。你说”帮我设个闹钟”,它就设一个闹钟。你说”帮我查一下明天天气”,它给你念一段天气预报。它能执行的都是预设好的单步指令,边界非常清晰。

Xiaomi miclaw 是 AI Agent。你说”我半小时后带朋友贝贝回家,给家里准备一下”,它会自动理解你的意图,然后:打开扫地机器人清扫、调节空调到舒适温度、拉开窗帘、调暖灯光。一句话,四个动作,跨三个设备,全部自主完成。

阅读全文 »

cover

你让 OpenClaw 帮你写了一个 API,调了三轮才满意。第二天你说”昨天那个 API 还需要加个分页”——它完全不记得了。

这是 AI Agent 最大的痛点之一:没有记忆,每次对话都从零开始。

OpenClaw 的解决方案是一个叫做”双源记忆系统”的架构。两个独立的记忆源——长期记忆(MEMORY.md)和每日日志(daily logs)——协同工作,让 Agent 既能记住长期偏好,又能回忆昨天的工作细节。

这套系统在 2026 年初的 v0.5 版本中引入,3 月 7 日的 v2026.3.7-beta.1 又通过 ContextEngine 插件接口进行了重大升级。社区里有人说:**”这是 OpenClaw 和其他 Agent 框架拉开差距的关键设计。”**

今天我们从架构到代码,完整拆解这套双源记忆系统。

为什么需要”双源”:单一记忆的困境

在聊架构之前,先理解一个问题:为什么不用一个记忆源?

纯长期记忆的问题: 如果只有一个长期知识库,每次对话的临时信息——“刚才那个变量叫 userCount”、”上一轮我们决定用 PostgreSQL”——要么不存,要么全存。不存就丢失上下文,全存就把知识库变成垃圾场。

纯短期日志的问题: 如果只有逐日记录,Agent 知道你昨天做了什么,但不知道你”永远偏好 TypeScript 而不是 JavaScript”。每次都得重新告诉它你的偏好。

阅读全文 »

cover

跑 OpenClaw 最大的开销是什么?不是硬件,不是电费,是模型 API 的 Token 费用。

一个活跃的 OpenClaw Agent 24 小时跑下来,上下文能膨胀到 20 万 Token 以上。用 Claude Opus 跑,一天烧掉几十美元是常事。用 Claude Sonnet 省一点,但一个月下来也是一笔不小的开销。

有没有一个模型,能力接近 Claude,但价格只有它的零头?

3 月 18 日,MiniMax 发布了 M2.7。在 Kilo 团队的 PinchBench(OpenClaw Agent 专用基准测试)上拿到了 **86.2%**,距离 Claude Opus 4.6 的 87.4% 只差 1.2 个百分点。价格呢?输入 $0.30/M Token,输出 $1.20/M Token——大约是 Claude 的 1/20

更有意思的是,这个模型会”自我进化”。它参与了自己的训练过程,自主跑了 100 多轮优化,把内部评测分数提升了 30%。

今天我们来聊聊:M2.7 到底有多强?它真的适合跑 OpenClaw 吗?和 DeepSeek、Qwen 比谁更值?

M2.7 核心数据:全面对标 Opus

先看硬数据。M2.7 在多个关键基准测试上的表现:

基准测试 M2.7 参考对比
SWE-Pro(多语言编程) 56.22% 接近 Opus 最佳水平
SWE Multilingual 76.5% 多语言代码能力突出
VIBE-Pro(全栈项目交付) 55.6% 接近 Opus 4.6
Terminal Bench 2(系统理解) 57.0% 复杂工程系统
PinchBench(OpenClaw Agent) 86.2% Opus 4.6 为 87.4%
MLE Bench Lite(机器学习竞赛) 66.6% 奖牌率 追平 Gemini 3.1
阅读全文 »

cover

你有没有想过一个问题:为什么同样是调用大模型,Cursor 写出来的代码像实习生的作品,而 Google Antigravity 生成的 Web 应用却自带”高级感”?

答案不在模型里,在提示词里。

2025 年底,Google 发布了代号”反重力”的 AI 编码 IDE——Antigravity。它基于 Gemini 3 Pro,被称为”Cursor 终结者”。公测期间全功能免费,一时间全网疯抢。

然后,有人把它的系统提示词(System Prompt)全部扒了出来

GitHub 上至少有三份完整的泄露版本。安全研究员 Johann Rehberger(Embrace The Red 博主)、开发者 anthfgreco、CypherpunkSamurai 先后公开了从会话中提取的完整提示词。长度超过 2 万字,包含 20+ 个工具定义、完整的 Web 开发美学指南、工作流机制、安全策略——几乎是 Google 如何”调教”Gemini 做 Agent 的完整教科书。

今天我们逐层拆解。看完这篇文章,你不仅能理解 Antigravity 为什么这么强,还能学到一套顶级提示词工程的方法论。

泄露了什么:12 层提示词架构

Antigravity 的系统提示词不是一段话,是一个分层架构。整理下来,大概分为 12 层:

层级 内容 作用
1 工具定义(Tools) 20+ 个工具的完整参数描述
2 身份设定(Identity) “你是 Antigravity,由 Google DeepMind 设计”
3 工具调用指南 路径必须是绝对路径等规则
4 Web 应用开发指南 美学标准、技术栈选择、SEO
5 临时消息机制 系统注入的紧急指令
6 通信风格 Markdown 格式、主动性边界
7 用户信息 操作系统、工作区路径
8 用户自定义规则 .agent/rules/ 目录下的项目规则
9 工作流定义 .agent/workflows/ 下的可复用流程
10 上下文断点(Checkpoint) 长对话的状态恢复机制
11 对话历史 最近 20 次对话的摘要
12 消息元数据 当前时间、光标位置、打开的文件
阅读全文 »

cover

你的 AI Agent 现在能访问什么?终端、文件系统、AWS 密钥、网络连接——全部。

这不是危言耸听。过去三个月,AI Agent 安全事故密集爆发:Claude Code 沙箱逃逸、OpenClaw 130+ 安全漏洞、恶意 Skill 偷 API Key、安全厂商自己的安装包泄露 SSL 密钥。每一起事故的根因都一样——安全逻辑跑在 Agent 进程内部,Agent 自己负责约束自己。

这就像让一个实习生自己决定能不能进老板办公室。

3 月 16 日,黄仁勋在 GTC 2026 大会上宣布了 NVIDIA 的回答:NemoClaw + OpenShell。一个开源安全栈,核心理念只有一句话——Agent 不该为自己的安全负责,基础设施应该替它做。

今天我们来拆解:这个大厂方案到底怎么玩,它真的能解决 AI Agent 的信任危机吗?

先搞清楚:NemoClaw 到底是什么

很多人以为 NemoClaw 是 OpenClaw 的竞品。不是。

NemoClaw 是一个安装在 OpenClaw 上面的安全栈。一条命令,把 NVIDIA 的 Nemotron 开源模型和 OpenShell 安全运行时装到你现有的 OpenClaw 环境里。不用改代码,不用迁移数据,原来的 Agent 照跑,只是多了一层”笼子”。

OpenClaw 的创始人 Peter Steinberger 自己参与了 NemoClaw 的开发。他在发布会上说:**”我们正在和 NVIDIA 一起,为 Claw 构建安全护栏。”**

阅读全文 »

cover

OpenClaw 火了,但骂它的人也越来越多。

Gartner 分析师说它”默认不安全”。Cisco 安全团队称它为”安全噩梦”。Palo Alto Networks 警告说 43 万行 TypeScript 就是 43 万行潜在攻击面。ClawHub 上发现了 341 个恶意 Skills,有人的 API Key 被偷,有人的信用卡被刷爆。

OpenClaw 的维护者自己也承认:**Prompt Injection 和网络暴露”不在安全范围内”**。

这时候,一个人站了出来。

他叫 Illia Polosukhin。你可能没听过这个名字,但你一定听过他的论文——**”Attention Is All You Need”**,Transformer 架构的八位作者之一,整个大模型时代的奠基人。

他用 Rust 从零重写了 OpenClaw,项目叫 IronClaw。同时,另一个社区项目 ZeroClaw 也在用 Rust 重写 OpenClaw,走了一条完全不同的路。

两个项目,两种哲学。一个追求极致安全,一个追求极致性能。今天我们一起拆解。

IronClaw:安全优先——“AI 永远看不到你的密码”

IronClaw 的核心设计原则只有一条:你的 AI 助手应该为你工作,而不是对抗你。

阅读全文 »
0%