Codex 进了 ChatGPT 手机 app，开盖步行者们可以合电脑了

发表于 2026-05-15 更新于 2026-07-13 分类于 AI 阅读次数：本文字数： 3.9k 阅读时长 ≈ 4 分钟

OpenAI于5月14日把Codex装进ChatGPT手机app并在iOS与Android同步预览，通过secure relay layer把电脑端的diff、终端输出和审批请求同步到手机，支持切换多个并行thread，文章对比Anthropic单线程遥控的Dispatch并分析其背后的B端竞争压力。

cover

哈喽，我是飞飞。

上个月 Business Insider 写了一篇报道，给一群开发者起了个名字，open-laptop walkers，中文意思是「开盖步行者」。报道里说，这些人半开着 MacBook 在办公室走廊里走、在学校教室里走，Business Insider 的记者甚至在滑冰场里都遇到过。理由很简单：本地的 AI agent 在跑长任务，合上盖就掐了。

我看到这个名字的时候笑了几秒，又有点尴尬。因为最近自己也在干同样的事。MacBook 抱在怀里，屏幕翻到 30 度，因为 Codex 还在跑一个 PR review，没耐心等它跑完再出门。

5 月 14 日，OpenAI 把这事正式写进了产品。Codex 进了 ChatGPT 手机 app，iOS、Android 同步预览，连免费用户都能用。当天 OpenAI 官方 X 账号发了一张图，几台 MacBook 半开着摆在桌上，配文是 “Step away from your laptop”。翻译过来：现在可以合上电脑了。

ChatGPT 手机 app 里的 Codex 入口：Introducing Codex mobile

说人话讲，OpenAI 这次干的事，是把开盖步行者这个梗正式收编成产品功能。

开盖步行者是怎么变成一个亚文化的

想搞懂为什么有人愿意举着电脑走两站地铁，得先看一眼 AI agent 现在长什么样。

传统的开发工具是同步的，你点回车，编译器立刻吐结果，你能盯着屏幕等。Codex、Claude Code 这一代不一样，它们更像一个远程实习生。你丢一个任务过去，它可能花 20 分钟去读项目、跑测试、写代码、提 commit。过程中还会停下来问你”我看到两种实现路径，要走哪条”。

你不可能盯着屏幕看 20 分钟。你会去倒杯水、去开会、去接孩子。但如果中途合上电脑，agent 就被 macOS 暂停了。

开盖步行者就是这么逼出来的。说白了就是工具链跟不上 AI 了：AI 已经能跑 20 分钟的长任务，但电脑还是那台合盖就掐的电脑。

OpenAI 自己也清楚这个梗。发布前一天还在 TikTok 上发了一条：”iykyk but we may be in for a treat soon 👀”，一边跟梗一边卖关子。

这次到底发了什么

我把 OpenAI 的官方博客和帮助文档对照着看了一遍，挑几条最实在的。

设置 Codex 移动版的三个动作：接续 / 跟进 / 起新任务

手机这一端做的不是”在手机上写代码”。代码、凭据、本地配置全留在你那台 Mac mini 或 MacBook 上，手机收到的是截图、终端输出、diff、测试结果、审批请求。OpenAI 给这套架构起了个名字叫 “secure relay layer”，关键作用是让你那台机器跨设备可达，但不暴露公网。

架构示意：手机—relay—电脑三方控制流

授权页长这样，整套设置流程不到一分钟：

允许 Codex 手机版访问这台电脑

具体能做的事情有这些：

看到电脑上所有正在跑的 thread，从一个切到另一个
看每个 thread 的当前 diff、终端输出、测试结果
在 agent 卡壳的时候补一句话给方向
审批一条 agent 想跑的命令
换一个模型继续跑
起一个全新的任务

要注意一个限制。今天这套手机端只能连 macOS 上的 Codex 桌面 app，Windows 的支持 OpenAI 说”coming soon”，Linux 暂时没提。

OpenAI 在公告里强调过一句话：”More than the ability to remotely control a single task”。这话其实直接指向 Anthropic。

跟 Anthropic 那套比，差在哪儿

去年秋天，Anthropic 给 Claude Code 出过一个叫 Dispatch 的远程控制功能。也是手机连到桌面、可以远程发指令。我自己用过几次，体验不算差。

Dispatch 跟这次 Codex 手机端的差别，主要在一点。Dispatch 是单线程遥控，每次远程发一个任务它独立跑；Codex 这次是把桌面端的整片工作面同步到手机，可以切多个并行的 thread，能看到桌面在同时跑的所有 agent 的当前状态。

打个不太准确的比方。Dispatch 像微信里发一条遥控命令，回个执行结果。Codex 手机端像随身带了一个真正的 dashboard，桌面有几个 worktree 在并行就有几个 worktree 出现在你手机上。

我自己用 Dispatch 遇到过最闹心的一个 bug。Claude 在电脑端弹出来的选择器，到了手机上没正确渲染，手指点哪儿都没反应，最后只能跑回电脑去 force quit。Codex 这次手机端我用了一晚上，至少这种渲染断层暂时没遇到。

这个差异值不值得换工具，看你怎么用。如果你平时只让 AI 串行跑任务，Dispatch 完全够用。如果你已经习惯桌面端开 3 个 worktree 同时让 agent 干活，那 Codex 这次的手机体验确实更顺。

背景顺带提一句。发布前一天，Sam Altman 在 X 上宣布”换 Codex 送两个月免费用量”，那是对 Anthropic 之前涨价的回应。两家在编程 agent 赛道的拉锯，已经从产品打到了价格上。

OpenAI 这两个月在 Codex 上为什么这么猛

回头看一眼 Codex 最近的更新节奏，就能感觉到 OpenAI 这次是真急了。

四月之前，Codex 还只是终端里的一个 CLI 工具。

四月之后，几乎每两周一个大功能：

Computer Use：Codex 接管电脑光标，自己看、点、敲键盘
内置浏览器：在网页上指哪改哪，不用再截图描述
Codex for Chrome：扩展用你已经登录的浏览器状态，开 Tab Group 干活不抢前台
直接生图：调用 gpt-image-2 把图丢进项目目录，代码引用路径自动改好
Hooks：自定义触发点，跑自己的脚本
手机端：今天这一串里最新的

已连接：电脑保持唤醒 + Computer Use + Chrome 扩展三个开关

为什么 OpenAI 这么猛，看一组数据就明白。

ChatGPT 周活逼近 10 亿，C 端是碾压式领先 Anthropic。但 4 月份 Anthropic 的 ARR 跑到了 300 亿美元，反过来超了 OpenAI。增长几乎全靠企业付费用 Claude Code。

OpenAI 的处境其实挺尴尬。C 端用户多到吓人，但 B 端营收被一家做 Coding Agent 的公司反超了。

Codex 这一连串猛更新，本质就是要把 ChatGPT 那 10 亿周活里的开发者，转化成持续付费的 Codex 用户。

身边已经有团队在切。理由意外朴素，就三个字：不封号。

之前同事在 Claude 上经常干到一半就被封号，全员切到 ChatGPT 生态之后，这事就再没出现过。

Mac mini 当 24/7 devbox，值不值得跟

整个发布里我最感兴趣的一个细节，是 OpenAI 反复在文案里点名 Mac mini。

“Codex will keep running on your laptop, Mac mini, or devbox.”

这是把一种玩法明确写进了产品定位。意思是：你可以买一台 Mac mini 放家里 24/7 开着，Codex 在上面长跑，本人随便拿手机指挥。

这套玩法之前要在云端 devbox 上干。每月几十刀租一台云机器，自己配 SSH 和 tmux 把 agent 挂着。要会运维、要会处理网络断连，新手门槛不低。

Mac mini 这条路对独立开发者来说省事很多。今年 M4 Mac mini 起售价 4500 块左右，按一个月 50 刀算云端 devbox 的话，半年硬件钱就回来了。家里有一台一直开着的 Mac mini，本身也能当 Time Machine、文件服务器、Plex，用途不止跑 Codex 一个。

要泼一盆冷水。如果你今天就想买一台 Mac mini 上车，先想清楚两件事。

一是网络。Codex 的 relay layer 虽然不要求公网 IP，但要求 Mac mini 长时间在线、不睡眠，路由器最好能给固定内网地址。二是模型用量。Codex 跑 24/7 长任务时 token 消耗肉眼可见，按 OpenAI 现在的套餐结构，Pro 才有比较安心的额度，Plus 用户跑两天可能会被限速。

实话讲，建议先用本人 MacBook 跑通工作流，确认每天真的有几个小时是”出门在外想接着干活”，再考虑 Mac mini。先把工作流跑通，再花这笔钱。

这次更新其实是工作节奏在变

OpenAI 在公告里留了一句话，我觉得是整篇博客里最值得划重点的：

“As agents take on longer-running work, a new rhythm for collaboration is emerging.”

这个节奏长什么样，我最近半年用 Claude Code 已经有体感。

早上起来在地铁上拍板昨晚跑过夜的 PR，午饭排队时让 agent 开始查一个昨天没解决的 bug，下班路上批准一个 migration 命令。人不再坐在工位上盯着 AI 写代码，而是在生活的缝隙里做关键决策点的审批。

这个节奏的好处显而易见：有效工作时间从”在工位的 8 小时”扩展到”清醒着的 16 小时”。但 Axios 在报道里点了一个真问题：在小屏幕上做多任务审批，误操作的风险也在涨。一个手指头点错，可能让 agent 跑一段 rm -rf 你没看清的命令。

这是 OpenAI 和 Anthropic 接下来都要面对的工程题。误审批怎么回滚、危险命令怎么二次确认、跨设备审计日志怎么留底，两家都没拿出完整方案。

Mac mini 普及和手机审批兜底，是我没想明白的两件事

开盖步行者可以合上电脑了，但电脑还得在家或办公室开着。开盖这个动作没消失，只是从随身换成了固定。

留两件我自己也没想清楚的事。

一件关于 Mac mini。如果家用 Mac mini 当 devbox 真的开始普及，独立开发者的小作坊会不会变得比以前更卷？以前一个人一台 MacBook 同时干一件事，以后一个人一台 Mac mini 同时挂 5 个 agent 干 5 件事。生产力拉满之后，自由职业者的接单上限是不是会重新被定义？

另一件关于审批 UX。手机审批今天能接受的命令上限到底是什么？是 git push 之前点一下，还是 rm -rf 之前点一下？万一手指头一抖怎么撤回？这事 OpenAI 在今天的发布里没讲清楚。

你最近开盖步行过吗？或者已经在用别的方式让本地 agent 长跑？我自己也在琢磨 Mac mini 这条路要不要走，评论区交流交流。