微软嫌 Anthropic 太贵，造了个便宜平替直奔我的 Claude Code，但我没打算换

发表于 2026-06-05 更新于 2026-07-28 分类于观点阅读次数：本文字数： 3k 阅读时长 ≈ 3 分钟

微软Build发布7个自研MAI模型，MAI-Code-1-Flash自称在SWE-Bench Pro比Claude Haiku 4.5高16分且省60% token，但MAI-Thinking-1对标的是上一代Opus 4.6，作者认可Anthropic贵是真痛点，却算出迁移的真正成本在重搭skill与工作流而非token单价。

cover

哈喽，我是飞飞。

这两天微软开 Build，本来是自家开发者的主场。结果热闹没全留给自己人，倒像一场公开分手现场。同一周里，微软对 OpenAI 喊出正面竞争，又对 Anthropic 放话「太贵，我们要自研便宜的替代」。

我刷到第二句的时候，手在屏幕上停了一下。因为微软嫌贵、想替掉的那个东西，正好是我每天在用的 Claude Code 背后那家。我这种靠它吃饭的人，等于被人当面指着说：你用的这玩意儿，贵得不值。

微软这周，把两个前盟友一起得罪了

先把事说清楚。微软 AI 这块的 CEO 是 Mustafa Suleyman，他在接受 Bloomberg 采访时的原话很冲：「Anthropic 极其昂贵，我认为很多人都在急着找替代品。」他直接把 Anthropic 列成微软最大的竞争对手，不是 OpenAI，并且摆明了要「干掉」微软每年付给 Anthropic 的那笔钱。

这话背后有本账。微软重新跟 OpenAI 谈过合约，拿到了用到 2032 年的模型折扣，所以 OpenAI 这边的成本它捏得住。可它跟 Anthropic 没有这种安排，付的是实打实的市场价。说白了，Anthropic 就成了那个最贵、又最该自己动手解决掉的依赖。

微软对 OpenAI 投了 130 亿、对 Anthropic 投了最多 50 亿，三大前沿实验室它占了两家的股，转头却在造跟这两家都打的模型。Suleyman 给自己定的目标是让微软挤进「世界前四的实验室」。这届 Build 的气味，The Verge 形容得很损：像一个刚离婚的人，转身就在社交平台发了张挑逗照。

它要替掉的，正好是我每天在用的那套

如果只是大厂之间为钱掰扯，我当个瓜看看就过了。问题是这次微软端出来的东西，瞄得太准。

Build 上微软一口气发了 7 个自研 MAI 模型，其中两个跟写代码的人贴身相关。

MAI-Code-1-Flash：一个 5B 的小型编程模型，特别之处是它直接在 GitHub Copilot 的生产环境里训练，不是先离线刷榜再塞进产品。官方自测说，它在 SWE-Bench Pro（一套真实代码修复任务的评测）上比 Claude Haiku 4.5 高 16 分，复杂任务还少烧 60% 的 token。现在已经进了 Copilot 的模型选择器，你省没省 token，自己的用量面板就能看到。

MAI-Thinking-1：微软第一个推理模型，35B 活跃参数的 MoE 架构（只激活一部分参数来省算力），从零用商业授权数据训练，不蒸馏、不碰 OpenAI 的数据，官方说编程基准上对标 Claude Opus 4.6，目前在 Foundry 私有预览。

更关键的是 Semafor 挖到的那句定位。微软在把这些模型调得跟自家 GitHub Copilot 严丝合缝，想把 Copilot 养成 Claude Code 的正面对手。Suleyman 自己讲：「我们更聚焦 Anthropic 那一路，企业、开发者和编程。」

读到这我就明白了。微软这套便宜平替奔着实处来，要抢的就是我每天敲着 Claude Code 干活的这块地。

便宜是真便宜，这话我得替微软认

按我的脾气，看到友商踩自己在用的工具，第一反应是想反驳。但这次我得先站到 Suleyman 那头，把他对的地方认了。

Anthropic 确实贵，这不是微软单方面的酸话。就在 Suleyman 喊话同一周，做 AI agent 平台的 Lindy 也亮了一笔账。创始人 Flo Crivello 公开说，他们把 100% 流量从 Anthropic 全切到了 DeepSeek V4，省下几百万美元。更意外的是，很多核心场景的性能不降反升。对一家天天靠模型跑业务的公司，推理费用是比工资还高的头号开销，这笔账谁都算得明白。

我自己也不是没感觉。实话讲，我每个月给 Anthropic 贡献的钱不算少。让 agent 干一件正经活之前，我都会下意识掂量一下值不值得动用 Opus，杂活就手动切便宜模型省点额度。这种「用之前先在心里过一遍秤」的绷着的感觉，就是「贵」最真实的体感。

所以微软的判断没错。市面上确实有一大票人，正捏着账单找出口。便宜这件事，是真需求，不是伪命题。

但它赢的，是上一代的那个便宜款

认完便宜，得说但是了。

那些漂亮的对比数字，全是微软自家测的。发布的时候没有第三方独立复现，benchmark 是不是在自己擅长的题面上跑出来的，外人没法验。这种官方自报的成绩，我向来打个折再看。

更要命的是对标的参照系。微软说 MAI-Thinking-1 对标 Claude Opus 4.6，可 Anthropic 早就把 Opus 4.7、4.8 都发出来了。换句话说，微软这个便宜平替对着打的，是一个已经被甩开一代的旧型号。Suleyman 自己采访里也承认了这点。

这就是问题所在。它赢的不是当下最强的 Claude，而是上一代里那个便宜的版本。拿今天的便宜款去比对方半年前的旧货，账面好看，可我每天真正在调的，是最新那一档。这一层差距，光看发布会的柱状图是看不出来的。

真要换，最贵的那笔从来不在 token 上

就算微软的模型又便宜又够用，我会不会换？我认真算了一下，反而更不想动了。

很多人算迁移这件事，只盯着每百万 token 省几块钱。可对我这种把工具用到骨头里的人，最贵的开销压根不在 token。我这套写作流水线，是十几个自定义 skill、一份越喂越厚的 CLAUDE.md、一摞 memory 堆出来的，整个长在 Claude Code 那套 frontmatter、hook、skill 的机制上。真要把底座换成别家，等于把这栋房子的地基刨了重浇。

举个具体的。光写文章这一条流水线，我就挂着十几个 skill，拉资讯的、查重的、配图的、发公众号的，每一个都是照着 Claude Code 读 skill、认 frontmatter、调 hook 的脾气一点点磨出来的。把模型底座换成别家，这些 skill 调工具时吐出来的格式十有八九会飘，我得挨个重新校一遍。光是把那套专门防 AI 味的 grep 规则重新调教顺，就够我搭进去好几个晚上。这些时间成本，省模型钱的那本账上从来不记。

这不是我矫情。前面提到切到 DeepSeek 省了百万的 Lindy，创始人自己也补了一句：这次迁移「比预想多干了 100 倍的活」。一家有工程团队的公司尚且如此，何况我这种把规则、记忆、习惯全压在一个生态里的个人。省下的那点模型钱，未必填得平重搭工作流的坑。

说到底，token 价只是账单上最显眼、也最不值钱的那一行。真正贵的，是你这几个月一点点调出来的那套手感和肌肉记忆。这部分，微软的发布会一个字都没替我算。

我不换，但这场互撕我举双手欢迎

绕回开头那个被当面嫌贵的瞬间。微软这波动作，会不会逼我把 Claude Code 换下来？答案是不会，我的根扎得太深，拔一次的代价远超那点新鲜。

但你要问我乐不乐意看到这场仗，我举双手。微软带着便宜模型冲进来，最直接的效果，是把价格这根弦绷到了 Anthropic 脸上。它要么把价钱往下压，要么把贵卖出让我心甘情愿掏钱的价值。无论哪条，对我这种掏钱的人都是好事。

巨头互相掀桌子的时候，桌子底下那个一直在付费的开发者，手里反而多了一张牌。我不急着用这张牌，但我喜欢它在我手上的感觉。

所以最后想认真问问你：如果有人专门造了个更便宜的模型，来抢你每天在用的那个编程工具，你会动心去试，还是先掂量自己那套工作流搬一次得掉多少层皮？你心里那笔迁移账，到底是 token 价占大头，还是别的什么？评论区聊聊。