手机里养龙虾?小米 miclaw 把 AI Agent 从电脑搬进了口袋

cover

你让 OpenClaw 帮你订机票、查天气、设闹钟,它都能做。但有一个前提——你得坐在电脑前。

这就尴尬了。我们一天 80% 的数字生活发生在手机上。聊天在手机上,打车在手机上,点外卖在手机上,控制家里的灯和空调也在手机上。AI Agent 再强大,如果只能待在电脑里,它就永远只是一个”工位助手”,而不是一个”生活助手”。

3 月 6 日,小米悄悄做了一件事:没有发布会,没有 PPT,直接开启了 Xiaomi miclaw 的小范围封测。

雷军在微博上只发了四个字:手机龙虾。

这是国内第一个手机端的类 OpenClaw AI Agent。它不是小爱同学的升级版,而是一个全新物种——能理解你的意图、自主拆解任务、调用 50 多个系统工具、联动整个米家生态的移动端智能体。

不是聊天机器人,是”能干活”的手机 Agent

先搞清楚一个概念:Xiaomi miclaw 和小爱同学完全不是一回事。

小爱同学是语音助手。你说”帮我设个闹钟”,它就设一个闹钟。你说”帮我查一下明天天气”,它给你念一段天气预报。它能执行的都是预设好的单步指令,边界非常清晰。

Xiaomi miclaw 是 AI Agent。你说”我半小时后带朋友贝贝回家,给家里准备一下”,它会自动理解你的意图,然后:打开扫地机器人清扫、调节空调到舒适温度、拉开窗帘、调暖灯光。一句话,四个动作,跨三个设备,全部自主完成。

这就是从”对话能力”到”系统级执行能力”的跨越。

技术架构:推理-执行循环

miclaw 的核心是一个基于小米自研 MiMo 大模型的推理-执行循环引擎:

  1. 接收用户输入:理解你想做什么(即使你说得很模糊)
  2. 自主推理:决定需要调用哪些工具、按什么顺序
  3. 执行操作:调用系统 API、第三方服务或米家设备
  4. 回传结果:检查执行结果,决定是否继续下一步
  5. 循环往复:直到任务完成

这套循环机制和 OpenClaw 的 Agent Loop 非常相似。区别在于,OpenClaw 调用的是电脑上的文件系统、浏览器、终端;miclaw 调用的是手机里的短信、日历、相机、WiFi、蓝牙,以及整个米家 IoT 生态。

50+ 系统工具,系统级权限

miclaw 以系统应用身份运行——不是普通的第三方 App,而是直接嵌入 HyperOS 操作系统。这意味着它能调用的能力远超普通应用:

能力类别 具体功能
通信 读写短信、拨打电话、联系人管理
日程 创建/查询日历事件、设置提醒
系统 截屏、录屏、WiFi/蓝牙开关、勿扰模式
媒体 打开相机、查看相册、播放音乐
信息 网页搜索、天气查询、导航
米家 控制灯光、空调、扫地机、窗帘、投影仪
第三方 高德导航、滴滴出行、麦当劳等 MCP 服务

一个关键设计:miclaw 不用模拟点击。

豆包手机助手之前火过一阵——用 AccessibilityService 模拟用户点击屏幕来操作 App。问题是,这种方式很容易被第三方 App 判定为”外挂”,导致封号。

miclaw 走了另一条路:通过 Intent 驱动和 AppTool SDK(AIDL 协议)实现原生协作。 不模拟点击,而是直接调用系统接口。更快、更稳定、被封号的风险极低。

四层能力:从工具到进化

小米把 miclaw 的能力分成了四个层次,层层递进:

第一层:系统底层能力。 50+ 个系统工具和生态服务的调用能力。这是 Agent 的”手脚”。

第二层:个人上下文理解。 miclaw 能读取你的短信、日历、使用习惯,理解你的生活模式。你收到一条火车票购买成功的短信,它会自动查目的地天气、建出行日程、设出发闹钟、推送到站提醒——你什么都不用做。

第三层:生态互联。 手机只是入口。通过米家协议,miclaw 可以控制超过 10 亿台连网设备。灯、空调、扫地机器人、电视、音箱、汽车座舱——整个”人车家全生态”都是它的操作范围。

第四层:自进化。 这是最有意思的部分。miclaw 有三个进化能力:

  • 记忆系统:记住你的偏好和习惯,越用越懂你
  • 子智能体:可以创建专门的子 Agent 处理特定任务
  • MCP 扩展:支持接入新的工具和服务,能力持续增长

还有一个隐藏大招:RN 小程序生成。 你用自然语言描述一个需求,miclaw 会自动生成一个 React Native 小程序,保存到手机里,以后可以随时调用。这相当于让 Agent 自己给自己造工具——PC 端的 OpenClaw 也是最近才有类似能力。

实测:能做什么?

封测期间,已经有不少用户拿到了测试资格。综合各方体验,miclaw 目前能做的事情包括:

日常效率类:

  • “帮我看看最近的短信,有没有重复扣费的” → 自动分析消费短信,发现某订阅服务重复扣费,提醒你可以省 55 美元/年
  • “帮我把今天和虾聊的内容整理成日记” → 自动生成对话摘要,写入小米笔记
  • “每小时查一次《飞驰人生 3》的票房,播报给我” → 设置定时任务,熄屏状态也能执行

智能家居类:

  • “我要写稿了” → 自动调亮显示器挂灯、根据天气拉窗帘、提醒接水、开启手机勿扰模式
  • “我半小时后带朋友回家” → 扫地机清扫、调空调、调灯光,一键迎客
  • “看我相册里拍的食物照片,下周帮我减 3kg” → 分析饮食照片,制定减重计划

系统操作类:

  • “帮我录屏” → 直接调用系统录屏功能
  • 语音输入日记 → 内置语音识别引擎,大模型后处理纠正专有名词

一个有趣的细节:miclaw 首月送 Token,0 成本试用。小米说了,”还是很能处的”。

和 OpenClaw 比,miclaw 赢在哪里?

很多人会拿 miclaw 和 OpenClaw 做比较。这两个产品的设计理念确实同源,但定位完全不同:

维度 Xiaomi miclaw OpenClaw(PC)
运行平台 手机(小米 17 系列) 电脑(macOS/Linux/Windows)
部署难度 零部署,系统更新即用 需要配置环境、API、依赖
核心模型 MiMo(小米自研) Claude/GPT/开源模型
工具生态 50+ 系统工具 + 米家 IoT 终端 + 文件系统 + 浏览器
IoT 控制 原生支持 10 亿+ 米家设备 需要额外配置
用户门槛 普通用户即可上手 需要一定技术基础
开放性 封闭生态,仅限小米设备 完全开放,支持任意模型
成熟度 早期封测 相对成熟

miclaw 赢在两个字:门槛。

OpenClaw 很强大,但要”养好一只龙虾”,你得懂命令行、会配置环境、能申请 API。社区投票显示,”刚上手,不会养”的用户占了大多数。甚至催生了一个叫”龙虾到家”的 O2O 平台——专门上门帮你装 OpenClaw。

miclaw 呢?手机系统更新,打开就用。不需要配置任何东西。这对普通用户来说,是降维打击。

但 miclaw 也有明显的局限:

第一,只支持小米 17 系列。 目前支持小米 17、17 Pro、17 Pro Max、17 Ultra、17 Ultra 徕卡版,共 5 款机型。没有小米 17,就没有 miclaw。

第二,生态封闭。 只能调用小米系统工具和米家设备。想连接 HomeKit、Google Home?不行。想换一个更强的模型?也不行。MiMo 是唯一选择。

第三,第三方 App 支持有限。 目前能调用的第三方服务还不多,主要靠 MCP 协议逐步扩展。和 OpenClaw 几乎无限的工具生态相比,miclaw 还有很长的路要走。

手机 Agent 大战开始了

小米不是唯一在做手机 Agent 的厂商。

36 氪的一篇分析指出,手机端 Agent 正在成为各大厂商的兵家必争之地:

  • 小米 miclaw:系统级 Agent,米家生态联动,Intent 驱动
  • 三星:也在推自己的 Agent 方案
  • Honor AI Agent:类似理念,承诺执行复杂任务
  • 豆包手机助手:AccessibilityService 模拟点击,通用但不稳定
  • 腾讯 QClaw:微信/QQ 入口,OpenClaw 的社交化包装

但 36 氪也观察到一个有趣的现象:所有厂商都很谨慎。

原因是豆包手机助手的前车之鉴。它太激进了——直接模拟点击操作第三方 App,结果被多个超级 App 围堵。手机端 Agent 天然对超级 App 存在替代效应,如果用户都通过 Agent 完成操作,谁还会打开 App?

所以小米选择了一条更稳的路:先做好系统工具和自家生态的调用,第三方服务通过 MCP 协议”礼貌地”接入,避免直接冲突。

36 氪的判断是:**”OpenClaw 正在推倒超级 App 构筑的壁垒。假以时日,Agent 手机很可能取代超级 App,成为 AI 时代的超级入口。”**

三级记忆:20 步也不忘初心

一个值得单独说的技术细节:miclaw 的三级智能记忆管理。

手机端 Agent 面临一个比 PC 更严峻的问题——算力有限,上下文窗口更小。当任务复杂到需要 20 步操作时,普通的 AI 早就忘了用户最初想干什么。

小米的方案是三级压缩:

  1. 轮次压缩:每轮对话结束后,压缩历史消息
  2. Token 压缩:对系统提示词进行多级精简
  3. 记忆系统:关键信息持久化存储

通过这套机制,miclaw 即使连续执行 20 步复杂操作,仍然能记住用户最初的需求。小米表示,这种多级设计可以节省 50%-90% 的 Token 开销

对比 OpenClaw 的双源记忆系统(MEMORY.md + 每日日志),miclaw 的记忆方案更偏向工程优化——在有限的移动端算力下,尽可能多地保留有效信息。

写在最后

回顾手机 AI 的进化史:

  • 2011-2023:语音助手时代(Siri、小爱)——“帮我设个闹钟”
  • 2024-2025:大模型上手机(豆包、通义)——“帮我改改这段话”
  • 2026:AI Agent 时代——“帮我把这件事从头到尾搞定”

每一次进化,AI 的角色都在发生质变。从回答问题,到修改内容,到完成任务。

Xiaomi miclaw 可能还不够成熟——只支持 5 款机型,第三方工具有限,偶尔还会出一些小问题。但它证明了一件事:手机里的龙虾,已经开始出现了。

当 Agent 从电脑走进手机,从屏幕走进家庭,从软件走进现实世界——AI 改变的就不只是工作方式,而是生活方式。

小米”人车家全生态”+ AI Agent 的组合,可能是目前最接近”AI 生活管家”这个愿景的方案。10 亿台米家设备,就是 Agent 伸向现实世界的 10 亿只手。


你会想在手机上养一只龙虾吗?如果手机 Agent 能帮你做一件事,你最希望它做什么?是自动整理短信、控制智能家居,还是帮你处理那些烦人的重复操作?评论区聊聊你的想法。