飞飞的AI实验室

用AI放大灵感,把想法变成作品。

cover

大家好,我是飞飞。

今天早上拉开窗帘,手机里 OpenAI 的推送先跳出来:GPT-5.5,代号”Spud”,已经开始给 Plus、Pro、Business、Enterprise 用户推送了。我昨天下午刚写完那篇讲 Copilot 停注册 + Claude Code 从 Pro 套餐下架的文章,里头我专门贴了 OpenAI Codex 负责人 Tibo 4 月 21 号那条 tweet:”We have the compute and efficient models to support it.”

那时候那句话我读起来还有点像口头表态。48 小时之后 OpenAI 把一个比 Claude Opus 4.7 高出 13 个百分点的新模型砸下来,那句话就变成实打实的动作了。

这一周从 4 月 20 号开始,AI 编程圈连着三件大事:GitHub 停 Copilot 个人订阅、Anthropic 把 Claude Code 从 Pro $20 页面拿掉、今天 OpenAI 放出 GPT-5.5。三件事的时间间隔不到 72 小时。

先把这次发布的东西摆出来

4 月 23 号下午(美西),OpenAI 把 GPT-5.5 正式发布。

距离 GPT-5.4(3 月 5 号)过去七周。按 Decrypt 的说法,GPT-5.3 到 5.4 只隔了两天,所以七周在现在的节奏里已经算长了。

几条关键信息:

  • 定位:OpenAI 自己的原话是 “our smartest and most intuitive-to-use model yet”。MarkTechPost 透露了一个更有分量的信息:这是从 GPT-4.5 以来第一个完整重新训练的基础模型,不是在 GPT-5 基础上继续微调的。
  • 谁能用:ChatGPT Plus、Pro、Business、Enterprise 今天开始推送。GPT-5.5 Pro 只给 Pro、Business、Enterprise。Free 用户没份。
  • API:这是今天最反常的一点。OpenAI 明确说 GPT-5.5 和 GPT-5.5 Pro 今天不进 API,理由原文是”API deployments require different safeguards and we are working closely with partners and customers on the safety and security requirements for serving it at scale”。承诺”very soon”。
  • Codex 环境:400K context window,还有 Fast 模式(生成速度快 1.5x,但成本贵 2.5x)。
  • 安全:OpenAI 说是”strongest set of safeguards to date”,发布前找了近 200 个 early-access 合作伙伴做真实场景测试,在高级网络安全和生物学能力上加了 targeted testing。
阅读全文 »

cover

大家好,我是飞飞。

今天傍晚 6 点左右,我对着一条马上要合进 master 的 develop 分支,跑了一次 /ultraview。这个分支改得挺狠:338 个文件改动,47329 行新增、18586 行删除。我提交完命令就去了趟厨房,回来一看云端已经把 2 个 finding 推过来了。一个是 bug,一个是 nit,两个如果没抓住都会合进 master。

底下我把它找到的两个问题摊开讲,顺带说说 /ultraview 的工作流程,对正在考虑要不要把它接进自己 PR 流程的人会有用。

先把这次的规模和结果摆出来

这是一个 Android RPA 项目,Kotlin 写的,业务上要跟几个外部 app 来回切换、做自动化的消息操作和任务状态管理。develop 分支我跟另一个同事改了一个多月,修了几个模块的 step 逻辑,加了两套新 step,顺带清理了一些老代码。

CLI 启动截图

/ultraview 在 CLI 里一输入,它就给我回了一行:”Free ultraview 1 of 3”。免费额度一共 3 次,这次用掉 1 次。然后告诉我它会在云端跑,预计 5-10 分钟,还给了一个 claude.ai/code 的 session URL 让我去 Web 上看进度。

这里有个关键点:扫描跑在 Anthropic 的云端,我这台笔电本地的 context 一个 token 都没占。同时段我还在另一个窗口里跟 Claude Code 聊别的事。

/ultraview 在云端跑了什么

阅读全文 »

cover

大家好,我是飞飞。

我自己现在是 Claude Max 5x 订阅者,$100 一个月那档。所以 4 月 20 日 GitHub 宣布暂停 Copilot 个人订阅、4 月 21 日下午 Anthropic 短暂把 Claude Code 从 Pro $20 套餐页面里下架的时候,我账号本身没受影响。

但这两件事连着发生,比”具体哪个套餐怎么改”更值得盯。

我写这篇的时候是 4 月 23 号下午。过去这一周,两家全球最大的 AI 编程工具供应商,在相隔不到 36 小时内,分别对他们的个人低价套餐动了刀。两家几乎同时动手,不像是各自的商业决策,更像是共同撞到了同一个现实:每月 10 块、20 块让用户随便跑 AI 写代码这种定价模型,已经撑不住了。

先把这周的三件事按顺序拆开

事情不是一夜发生的。往前倒四天。

4 月 13 日,GitHub 先把 Copilot Pro 的免费试用关了,理由写的是”调查滥用行为”。这一步没太多人注意。

4 月 20 日,GitHub VP of Product Joe Binder 发了篇官方博客,宣布三件事:Copilot Pro、Pro+、Student 三档个人套餐的新注册全部暂停;现有用户的使用限额收紧;Opus 系列模型从 Pro 套餐里彻底拿掉,Opus 4.7 只保留在 Pro+。Binder 这段话挺扎心的原文:

“It’s now common for a handful of requests to incur costs that exceed the plan price.”

阅读全文 »

cover

大家好,我是飞飞。

今天凌晨 OpenAI 官号发了条推,正式发布了 ChatGPT Images 2.0

我今早起来第一件事就是打卡 ChatGPT 来测试 Images 2.0,扔了一个搁了好几天的需求进去——给公众号”飞飞的 AI 实验室”生成一张带”Feifei”字样的卡通头像。

这事我之前用 Nano Banana Pro 跑过十来次,要么人脸糊掉,要么衣服上”Feifei”几个字母被渲染成歪歪扭扭的符号,总之不管怎么样都不太满意。

GPT Image 2 生成的头像

30 秒后就是这张,当时我直觉就是”这下搞定了”。

“Feifei”五个字母的衬线全部对上,眼镜、笔记本上”AI Lab”的小字、右边书脊”AI / Agent / LLM”三本书的名字——全部清清楚楚。

我顺手追问了一句”去掉圆形 LOGO,只保留文字,文字显示一行并居中显示”,它第二次出图精准地把我指的那个脖子上的吊坠删了,没动其他元素。

追问它做局部编辑的那轮对话

阅读全文 »

cover

大家好,我是飞飞。

今早我是被手机推送叫醒的。SpaceX 宣布拿下了以 600 亿美金整体收购 Cursor 的权利,如果不行权,也要支付 100 亿美金深化合作。

我从床上爬起来,打开笔记本。桌面上 Cursor 的窗口还停在前一晚的位置:一段 React 组件改了一半,右侧 Composer 还挂着 Claude Sonnet 的上下文。

这是我过去三个月雷打不动的工作流。Cursor 的 Composer 改前端,右边另开一个 Claude Code 终端跑后端和脚本。每月两边订阅费加起来 40 美金出头。

我盯着那个 600 亿的数字看了一会儿。比奥特曼 2024 年第一次出价高了三倍,比 Cursor 最近跟 a16z 谈的那轮估值还多 100 亿。然后我做了件自己都觉得有点好笑的事:把 Cursor 的订阅账单翻出来,看了一眼续订日期。

先把这个 600 亿 + 100 亿的结构讲清楚

公告本身有点绕,我在 X 上看了三遍才看懂。

SpaceX 并没有”买下”Cursor,它拿到的是一个”今年晚些时候”以 600 亿美金整体收购 Cursor 的权利(option),也可以选择不行权,但要支付 100 亿美金作为双方合作的补偿。

一句话:600 亿行权,或者 100 亿走人

阅读全文 »

cover

大家好,我是飞飞。

前天晚上我在地铁上给 Telegram 里的一个叫”Hermes”的机器人发了一条消息——“帮我把上周写 Hexo 博客用的那个发布流程记一下”。

它回我一句:”需要把’跑 hexo clean 再 g 再 d’这一步写进 SKILL 吗?上周五你提到过这个顺序卡过一次。”

我停下来看了手机 30 秒——我从没告诉过它我用 Hexo。也没告诉过它上周五我被这步卡过。

这条消息的上下文它是从两周前我在 mac 终端里敲下的第一句话里自己攒下来的。

今天这篇写的就是这个叫 Hermes Agent 的东西——它是怎么装进我服务器的,为什么我装了它之后两周,它开始比我自己还记得我的习惯。

What——Hermes 到底是个什么东西

用一句话讲清楚最难,我试试。

想象一下你雇了一个管家,住进你家。第一天他什么都不懂,你让他干什么他就干什么。第二天你说”早上 7 点帮我煮咖啡”,他记下来。第三天你说”煮黑咖就行不用加奶”,他在笔记本上改了一笔。一个月后,这个管家知道你周一到周五起得早、周末 10 点才要咖啡、喝完第二杯就要开始写稿。

阅读全文 »

cover

大家好,我是飞飞。

今天下午我做了个实验——同一句 prompt 先喂 Google Stitch,再喂 Claude Design,看谁给的东西我更愿意留下来用。

prompt 是”帮我做一个 AI 写作工具的订阅落地页,主色深紫,参考 Linear 的风格”。

Stitch 35 秒给了 5 个屏:首页 / 定价 / 功能详情 / 登录 / 付款成功。点 Play 能在屏幕之间跳转,导出可以选 React + Tailwind,扔进我本地工程一分钟就跑起来了。

Claude Design 50 秒给了 1 个屏,单页长滚动,hero + 功能 + 定价 + FAQ + 注册表单全在一张画布上。右上角有个”Send to Claude Code”的按钮,我点下去,Claude 自己在终端里开了一个 worktree,把整个页面写成 Next.js 项目,半小时后 PR 就进来了。

两家的差别从这一刻我就明白了——Stitch 给的是设计稿,Claude Design 给的是 PR。

Stitch 与 Claude Design 工作流对比

Stitch 其实是先来的那个

我知道很多人是从 4 月 17 日 Claude Design 发布才开始关心这个赛道,其实真把 Figma 股价先砸下去的是 Stitch。

阅读全文 »

cover

大家好,我是飞飞。

昨天早上我还在 Cursor 里改一段 Python,打开 X 随手一刷,看见 Sundar Pichai 那条推顶着一张 Gemini 菱形 logo 的截图——“It’s the first time we’re bringing the Gemini app to desktop.”

第一反应是”怎么现在才来”。ChatGPT Mac 版我用了快一年,Claude for Mac 也早就有,Google 居然是三家里最后一个上桌面的。

我放下键盘打开 gemini.google/mac,一张 DMG 的下载链接,37 秒拉下来。装上之后第一次按 Option + Space,整个屏幕中央浮出一个窗口,左下角有个 “Share Window” 的按钮。我把它指向 Cursor 的那段代码,随口说了一句”帮我看一下这段为什么没走到第 23 行的 if”。

它没让我贴代码。它直接开始说”你这段在 17 行就 return 了,23 行进不去”。

我当时把键盘往桌上一拍——它真的在看我屏幕。

Gemini Mac 版是什么时候发的

北京时间 2026 年 4 月 16 日凌晨,Google 把 Gemini 的 macOS 原生应用推上线。要求 macOS 15 Sequoia 或更新、只跑 Apple Silicon(M1 及以上)。免费,全球可用,所有支持 Gemini 的语言都有。

下载地址是一句话能记住的 URL:gemini.google/mac。

阅读全文 »

cover

大家好,我是飞飞。

昨晚 23 点多我本来在收尾一篇稿子,顺手刷了下 X。Anthropic 官号在 9 分钟前发了一条推——“Introducing Claude Design”。我点进去的时候,官网的演示视频还没加载完。

Claude 官号 @claudeai 发布 Claude Design 的原推文

北京时间 2026 年 4 月 17 日 23:00,旧金山早上 8 点,Anthropic Labs 把 Claude Design 推上来了。

订阅 Pro 以上的用户打开 claude.ai/design 就能用。一句话生成 prototype、slide deck、landing page、marketing 素材,画布上直接改、导出成 PDF / PPTX / HTML,或者一键塞给 Claude Code 让它把代码写出来。

昨晚美股开盘,Figma(NYSE: FIG)盘中最低跌了 7.82%,收盘跌 6.89%,从前一天的 20.32 美元跌到 18.92 美元。

一周前我写过一篇——Opus 4.7 还没发布,Figma 就先跌了 6%。那篇的结尾我留了一个问号:Figma 接下来会怎么走。一周过去,答案就是这根收盘价 18.92 美元的阴线。

Claude Design 到底是个什么东西

官方说法是:research preview,Pro / Max / Team / Enterprise 订阅里直接开。底下跑的是前天(4 月 16 号)发的 Opus 4.7——那个视觉分辨率涨到 2576 像素、能一口吃下一整屏 Figma 截图的版本。

阅读全文 »

cover

大家好,我是飞飞。

4 月 8 号凌晨,我本来在改稿子,顺手打开 DeepSeek 问一个文案问题。输入框上方多了两个图标——一个闪电,一个钻石。鼠标悬停过去,一个写「适合日常对话,即时响应」,另一个写「擅长复杂问题,高峰需等待」。

没有发布会,没有 blog,连一条官方推文都没有。DeepSeek 就这么把快速模式和专家模式推上来了。

今天已经是 4 月 17 号,这 9 天里我把这两个模式当作日常主力用了一遍,也翻了智东西、爱范儿、Reddit 的实测,加上梁文锋内部披露的 V4 时间线。这篇把我盯下来的东西一次讲完。

先看这两个模式到底在差什么

快速模式是闪电图标,日常对话、响应即时,支持图片和文件里的文字识别——本质还是 OCR 拼文本,不是真的看图。

专家模式是钻石图标,擅长复杂问题,高峰需要排队等。现在这个模式反而更”简陋”一点——不支持文件上传,没有多模态,连上传按钮都直接隐藏了。

两个模式的后台有两个共同点:知识库都截止到 2025 年 5 月,上下文窗口都是 1M tokens。

看到这儿我还没反应过来:为什么更强的模式,功能反而更少?

阅读全文 »
0%