Codex 进了 ChatGPT 手机 app,开盖步行者们可以合电脑了

cover

哈喽,我是飞飞。

上个月 Business Insider 写了一篇报道,给一群开发者起了个名字,open-laptop walkers,中文意思是「开盖步行者」。报道里说,这些人半开着 MacBook 在办公室走廊里走、在学校教室里走,Business Insider 的记者甚至在滑冰场里都遇到过。理由很简单:本地的 AI agent 在跑长任务,合上盖就掐了。

我看到这个名字的时候笑了几秒,又有点尴尬。因为最近自己也在干同样的事。MacBook 抱在怀里,屏幕翻到 30 度,因为 Codex 还在跑一个 PR review,没耐心等它跑完再出门。

5 月 14 日,OpenAI 把这事正式写进了产品。Codex 进了 ChatGPT 手机 app,iOS、Android 同步预览,连免费用户都能用。当天 OpenAI 官方 X 账号发了一张图,几台 MacBook 半开着摆在桌上,配文是 “Step away from your laptop”。翻译过来:现在可以合上电脑了。

ChatGPT 手机 app 里的 Codex 入口:Introducing Codex mobile

说人话讲,OpenAI 这次干的事,是把开盖步行者这个梗正式收编成产品功能。

开盖步行者是怎么变成一个亚文化的

想搞懂为什么有人愿意举着电脑走两站地铁,得先看一眼 AI agent 现在长什么样。

传统的开发工具是同步的,你点回车,编译器立刻吐结果,你能盯着屏幕等。Codex、Claude Code 这一代不一样,它们更像一个远程实习生。你丢一个任务过去,它可能花 20 分钟去读项目、跑测试、写代码、提 commit。过程中还会停下来问你”我看到两种实现路径,要走哪条”。

你不可能盯着屏幕看 20 分钟。你会去倒杯水、去开会、去接孩子。但如果中途合上电脑,agent 就被 macOS 暂停了。

开盖步行者就是这么逼出来的。说白了就是工具链跟不上 AI 了:AI 已经能跑 20 分钟的长任务,但电脑还是那台合盖就掐的电脑。

OpenAI 自己也清楚这个梗。发布前一天还在 TikTok 上发了一条:”iykyk but we may be in for a treat soon 👀”,一边跟梗一边卖关子。

这次到底发了什么

我把 OpenAI 的官方博客和帮助文档对照着看了一遍,挑几条最实在的。

设置 Codex 移动版的三个动作:接续 / 跟进 / 起新任务

手机这一端做的不是”在手机上写代码”。代码、凭据、本地配置全留在你那台 Mac mini 或 MacBook 上,手机收到的是截图、终端输出、diff、测试结果、审批请求。OpenAI 给这套架构起了个名字叫 “secure relay layer”,关键作用是让你那台机器跨设备可达,但不暴露公网。

架构示意:手机—relay—电脑三方控制流

授权页长这样,整套设置流程不到一分钟:

允许 Codex 手机版访问这台电脑

具体能做的事情有这些:

  • 看到电脑上所有正在跑的 thread,从一个切到另一个
  • 看每个 thread 的当前 diff、终端输出、测试结果
  • 在 agent 卡壳的时候补一句话给方向
  • 审批一条 agent 想跑的命令
  • 换一个模型继续跑
  • 起一个全新的任务

要注意一个限制。今天这套手机端只能连 macOS 上的 Codex 桌面 app,Windows 的支持 OpenAI 说”coming soon”,Linux 暂时没提。

OpenAI 在公告里强调过一句话:”More than the ability to remotely control a single task”。这话其实直接指向 Anthropic。

跟 Anthropic 那套比,差在哪儿

去年秋天,Anthropic 给 Claude Code 出过一个叫 Dispatch 的远程控制功能。也是手机连到桌面、可以远程发指令。我自己用过几次,体验不算差。

Dispatch 跟这次 Codex 手机端的差别,主要在一点。Dispatch 是单线程遥控,每次远程发一个任务它独立跑;Codex 这次是把桌面端的整片工作面同步到手机,可以切多个并行的 thread,能看到桌面在同时跑的所有 agent 的当前状态。

打个不太准确的比方。Dispatch 像微信里发一条遥控命令,回个执行结果。Codex 手机端像随身带了一个真正的 dashboard,桌面有几个 worktree 在并行就有几个 worktree 出现在你手机上。

我自己用 Dispatch 遇到过最闹心的一个 bug。Claude 在电脑端弹出来的选择器,到了手机上没正确渲染,手指点哪儿都没反应,最后只能跑回电脑去 force quit。Codex 这次手机端我用了一晚上,至少这种渲染断层暂时没遇到。

这个差异值不值得换工具,看你怎么用。如果你平时只让 AI 串行跑任务,Dispatch 完全够用。如果你已经习惯桌面端开 3 个 worktree 同时让 agent 干活,那 Codex 这次的手机体验确实更顺。

背景顺带提一句。发布前一天,Sam Altman 在 X 上宣布”换 Codex 送两个月免费用量”,那是对 Anthropic 之前涨价的回应。两家在编程 agent 赛道的拉锯,已经从产品打到了价格上。

OpenAI 这两个月在 Codex 上为什么这么猛

回头看一眼 Codex 最近的更新节奏,就能感觉到 OpenAI 这次是真急了。

四月之前,Codex 还只是终端里的一个 CLI 工具。

四月之后,几乎每两周一个大功能:

  • Computer Use:Codex 接管电脑光标,自己看、点、敲键盘
  • 内置浏览器:在网页上指哪改哪,不用再截图描述
  • Codex for Chrome:扩展用你已经登录的浏览器状态,开 Tab Group 干活不抢前台
  • 直接生图:调用 gpt-image-2 把图丢进项目目录,代码引用路径自动改好
  • Hooks:自定义触发点,跑自己的脚本
  • 手机端:今天这一串里最新的

已连接:电脑保持唤醒 + Computer Use + Chrome 扩展三个开关

为什么 OpenAI 这么猛,看一组数据就明白。

ChatGPT 周活逼近 10 亿,C 端是碾压式领先 Anthropic。但 4 月份 Anthropic 的 ARR 跑到了 300 亿美元,反过来超了 OpenAI。增长几乎全靠企业付费用 Claude Code。

OpenAI 的处境其实挺尴尬。C 端用户多到吓人,但 B 端营收被一家做 Coding Agent 的公司反超了。

Codex 这一连串猛更新,本质就是要把 ChatGPT 那 10 亿周活里的开发者,转化成持续付费的 Codex 用户。

身边已经有团队在切。理由意外朴素,就三个字:不封号。

之前同事在 Claude 上经常干到一半就被封号,全员切到 ChatGPT 生态之后,这事就再没出现过。

Mac mini 当 24/7 devbox,值不值得跟

整个发布里我最感兴趣的一个细节,是 OpenAI 反复在文案里点名 Mac mini。

“Codex will keep running on your laptop, Mac mini, or devbox.”

这是把一种玩法明确写进了产品定位。意思是:你可以买一台 Mac mini 放家里 24/7 开着,Codex 在上面长跑,本人随便拿手机指挥。

这套玩法之前要在云端 devbox 上干。每月几十刀租一台云机器,自己配 SSH 和 tmux 把 agent 挂着。要会运维、要会处理网络断连,新手门槛不低。

Mac mini 这条路对独立开发者来说省事很多。今年 M4 Mac mini 起售价 4500 块左右,按一个月 50 刀算云端 devbox 的话,半年硬件钱就回来了。家里有一台一直开着的 Mac mini,本身也能当 Time Machine、文件服务器、Plex,用途不止跑 Codex 一个。

要泼一盆冷水。如果你今天就想买一台 Mac mini 上车,先想清楚两件事。

一是网络。Codex 的 relay layer 虽然不要求公网 IP,但要求 Mac mini 长时间在线、不睡眠,路由器最好能给固定内网地址。二是模型用量。Codex 跑 24/7 长任务时 token 消耗肉眼可见,按 OpenAI 现在的套餐结构,Pro 才有比较安心的额度,Plus 用户跑两天可能会被限速。

实话讲,建议先用本人 MacBook 跑通工作流,确认每天真的有几个小时是”出门在外想接着干活”,再考虑 Mac mini。先把工作流跑通,再花这笔钱。

这次更新其实是工作节奏在变

OpenAI 在公告里留了一句话,我觉得是整篇博客里最值得划重点的:

“As agents take on longer-running work, a new rhythm for collaboration is emerging.”

这个节奏长什么样,我最近半年用 Claude Code 已经有体感。

早上起来在地铁上拍板昨晚跑过夜的 PR,午饭排队时让 agent 开始查一个昨天没解决的 bug,下班路上批准一个 migration 命令。人不再坐在工位上盯着 AI 写代码,而是在生活的缝隙里做关键决策点的审批。

这个节奏的好处显而易见:有效工作时间从”在工位的 8 小时”扩展到”清醒着的 16 小时”。但 Axios 在报道里点了一个真问题:在小屏幕上做多任务审批,误操作的风险也在涨。一个手指头点错,可能让 agent 跑一段 rm -rf 你没看清的命令。

这是 OpenAI 和 Anthropic 接下来都要面对的工程题。误审批怎么回滚、危险命令怎么二次确认、跨设备审计日志怎么留底,两家都没拿出完整方案。

Mac mini 普及和手机审批兜底,是我没想明白的两件事

开盖步行者可以合上电脑了,但电脑还得在家或办公室开着。开盖这个动作没消失,只是从随身换成了固定。

留两件我自己也没想清楚的事。

一件关于 Mac mini。如果家用 Mac mini 当 devbox 真的开始普及,独立开发者的小作坊会不会变得比以前更卷?以前一个人一台 MacBook 同时干一件事,以后一个人一台 Mac mini 同时挂 5 个 agent 干 5 件事。生产力拉满之后,自由职业者的接单上限是不是会重新被定义?

另一件关于审批 UX。手机审批今天能接受的命令上限到底是什么?是 git push 之前点一下,还是 rm -rf 之前点一下?万一手指头一抖怎么撤回?这事 OpenAI 在今天的发布里没讲清楚。

你最近开盖步行过吗?或者已经在用别的方式让本地 agent 长跑?我自己也在琢磨 Mac mini 这条路要不要走,评论区交流交流。