最强的 Claude 来了,可我盯着价格又把手缩了回来

cover

哈喽,我是飞飞。

我每个月给 Anthropic 的钱不算少。所以让 agent 干一件正经活之前,我都有个下意识的动作:在心里先过一遍秤,掂量这活值不值得动用最贵那档模型,杂活就手动切个便宜的,省点额度。

昨天 Anthropic 把 Claude Fable 5 放了出来,号称是迄今对公众开放的最强模型。我第一反应是想冲。点开价格那一栏,手又缩了回来。

我不打算假装连夜做了什么详细实测。一个模型刚落地半天就敢喊「我实测了」的,基本可以取关。我想聊的是另一件事:一个每天靠 Claude 干活、还得盯着额度的人,看最强模型落地的那一刻,心里到底在纠结什么。

先把话说清楚,它是真的强

Fable 5 不在 Opus 这条线上。它来自 Anthropic 内部那个叫 Mythos 的更高层级,以前只给少数搞网络安全和生物医药的合作方用。这回放给所有人的,是加了安全护栏的版本。

强到什么程度?官方那张基准表,几乎每一行都压在第一。挑一个程序员最有体感的:SWE-bench Pro 这种考真实工程任务的,它拿了 80.3 分,同期 GPT-5.5 才 58.6。这种领先不靠挤牙膏,差不多是甩开一整截的差距。

实话讲,比跑分更唬人的是真实案例。Stripe 拿它迁一个 5000 万行的 Ruby 老代码库,全库迁完只花了一天,换人工团队得搭进去两个多月。还有人只给它喂屏幕截图、不配任何外挂工具,让它自己通关了《宝可梦火红》和《异星工厂》。

官方反复强调的一句话我觉得最该记住:任务越长、越复杂,它甩开其他模型越多。你拿它秒回一句话,感受不到差距;你扔给它一个要跑几小时、几十步、跨一堆文件的活,差距才出来。

这种长活我太有体感了。上周我就把一个跨好几个文件的重构,一句话丢给 Claude Code,它自己开了个 git worktree,列好计划,一个文件一个文件改,中间自己跑测试,挂了回头修,弄完才喊我看。我去厨房热了个饭,回来活已经干了一半。

Fable 5 主打的,正好就是这种我天天在用、又最吃模型能力的场景。它越能扛,我越眼馋。

它不是陪你聊天解闷的,是替你扛长活的。

可它也是主流里最贵的那个

夸完了,得说钱。

Fable 5 的价格,是输入每百万 token 10 美元,输出 50 美元。官方话术是「不到上一代 Mythos 预览版的一半」,这话不假,那个版本确实贵到 30 和 150。

但说白了,你别被这个「便宜了一半」绕进去。横过来比一眼就清楚:Opus 4.8 是输入 5、输出 25,Fable 5 整整翻了一倍。它是现在全球主流模型里最贵的一个,没有之一。

贵到什么体感?这事 Anthropic 自己最实诚。你在 Max 套餐里点开 Fable,它会先弹一句话给你:这是目前最强的模型,但消耗额度的速度是 Opus 的两倍,6 月 22 号之前免费用。

它等于把价目表上那个「两倍」,直接搬到了你的用量条上,挑明了讲:同一件活交给它,额度掉得比 Opus 快一倍。有用 Max 200 美元月套餐的人实测,跑三个任务就干掉了五小时额度的 73%,正好给这句官方提醒做了脚注。

这一下,我那个「过秤」的动作就更重了。以前是动用 Opus 前掂量一下,现在面对 Fable 5,我得过两遍秤:头一遍问这活配不配用它,第二遍问我这点额度经不经得起它这么烧。省钱那本账上,从来不记这种时时刻刻绷着的精神成本。

更要命的是,我跟 Claude 早就绑死了。我光写文章这一条流水线,就挂着十几个 skill:拉资讯的、查重的、配图的、发公众号的,每一个都是照着 Claude Code 读 skill、认 frontmatter 的脾气一点点磨出来的,光那套专门防 AI 味的 grep 规则,就搭进去好几个晚上。

真要嫌它贵想换个便宜底座,这些 skill 调工具吐出来的格式十有八九会飘,得挨个重新校一遍。所以它涨它的价,我这边连掀桌子走人的底气都没有,只能眼睁睁看着秤砣又压重一截。

你买的是 Fable 5,端上来的有时候是 Opus 4.8

还有个更拧巴的设计。

因为 Mythos 这条线能力太猛,碰网络安全、生物化学这些高风险领域容易出事,Fable 5 上面叠了一层分类器。一旦它判断你的请求踩到了网络安全、生物化学或者模型蒸馏这三条线,就自动改用次一档的 Opus 4.8 来答,再告诉你一声「这条我降级了」。

官方说 95% 的常规对话不受影响。可上线头几天,这层护栏被不少人吐槽「过于敏感」,官方自己也认了,说初期配置得有点草木皆兵,后面会慢慢调。最离谱的一个例子,有人让它审查自己代码里的安全漏洞,被当成搞攻击给拒了。

你花着全球最贵的钱,结果一脚踩进它划的雷区,端上来的反倒是那个便宜一半的 Opus。这事搁谁心里都得咯噔一下。

免费窗口就十二天,烧的还是你自己的额度

可用性这块,也有个坑得提醒。

现在到 6 月 22 号,Pro、Max、Team 这些订阅套餐里能免费用 Fable 5。听着挺香,但这个「免费」是打引号的,它照样消耗你订阅里那点额度,而且按上面那个烧法,掉得飞快。

过了 6 月 23 号,它就从订阅套餐里撤出去,只能走 API 按量付费。官方说等以后容量够了,再考虑放回订阅标配,但没给准话,也没给日期。

所以真想在这十二天里薅一把,我的建议是别拿它干杂活。专挑那种你平时不敢交给模型、又臭又长的硬骨头喂给它,才对得起这个价。短问题上花两倍的钱,买不到两倍的体感。

国区?还是那两个熟悉的字

聊到这,得说句每次都绕不开的丧气话。

国区。还是没份。

Claude 从第一天起就没正式进过中国大陆。Fable 5 再强,对国内用户来说,值不值这个价都是后话,第一道坎是你压根用不上。想碰,要么自己折腾 API,要么挂个海外身份。

每次这种最强模型发布,海外那头热火朝天,热搜、实测、晒 demo 排着队来,我们这边能做的大概率还是隔着屏幕干看,顺手在评论区刷一句「什么时候轮到我们」。

遥遥无期这四个字,年初这么说,现在还这么说,照这架势,到年底多半还得接着说。这种被一次次提醒「最强的东西没你的份」的滋味,老用户应该都懂。

最强,和够得着,是两件事

绕了一圈,我对 Fable 5 的感受其实挺简单。

它把能力的天花板又往上顶了一大截,这点我服气,也眼馋。但「最强」和「我们能稳稳用上」,从来是两件事。说到底,它最强,可它也最贵、烧额度、会自动降级、国区还用不了。天花板是抬高了,普通人脚底下那块能踏实站的地,没跟着抬高多少。

所以我还是会回到那个老动作:用之前,先过一遍秤。只不过这回的秤砣,沉了一倍。

接下来这阵子,有几件事我会接着盯:6 月 22 号免费窗口一关,它到底怎么收费;那层「草木皆兵」的护栏会调到多松;还有那个永恒的问题,国区到底什么时候能有份。

最后想问问你:要是这十二天免费窗口你也能用上,你手头有没有那种攒了很久、一直不敢交给模型的硬活,正好拿它来开一刀?评论区聊聊。


参考资料

  • [[claude-fable-5-mythos-5-release]]

相关洞察

  • [[claude-fable-5-最强但够不着]]