2026 年，Token 变成了石油

发表于 2026-04-14 更新于 2026-07-13 分类于观点阅读次数：本文字数： 2.8k 阅读时长 ≈ 3 分钟

从国家数据局公布的日均词元调用量突破 140 万亿（两年涨 1000 多倍）切入，结合黄仁勋 Token is the new commodity 论断、微软 Copilot 让 Claude 审查 GPT 提升 13.8% 等案例，论证 Agent 时代 Token 正在成为像石油一样的生产资料和结算单位。

cover

大家好，我是飞飞。

上个月国家数据局开了个发布会，里面有一组数字让我停下来想了很久。

我国日均词元调用量已经突破 140 万亿。2024 年初是 1000 亿。两年，涨了 1000 多倍。

“日均词元调用量 140 万亿”——这个句式你熟悉吗？它跟”日产粗钢 300 万吨”是一个语感。当一个技术概念开始用这种句式来汇报的时候，它就不再是技术概念了。它变成了工业产能。

同一个月，黄仁勋在 GTC 2026 上说了一句话：”Token is the new commodity。” Token 是新的大宗商品。

大宗商品是什么？石油、钢铁、铜。用来造东西的原材料。你不会直接消费它，但你消费的一切都离不开它。

黄仁勋的意思是：Token 就是 AI 时代的石油。

为什么突然涨了 1000 倍

2024 年的时候，我们用大模型主要干一件事：聊天。你问一句，它答一句，消耗几百个 Token，一轮对话下来可能几千个。

但 2026 年不一样了。现在大模型开始”干活”了。

今年初 OpenClaw 爆火，带着整个 Agent（智能体）生态起飞。Agent 跟聊天最大的区别是：聊天是你问一句它答一句，Agent 是你下一个指令，它自己规划、拆解、调工具、执行，中间可能调用几十次模型，消耗的 Token 量是普通对话的几百倍。

我自己的博客写作流水线就是个例子。我说一句”帮我写一篇关于 Anthropic 营收的文章”，Claude Code 会自己搜索资料、抓取网页、整理素材、写初稿、检测 AI 味、修改、生成封面图、转成公众号和小红书版本。整个流程下来，消耗的 Token 数量是我手动聊天的几百倍。

这还只是一个人、一篇文章。想象一下几百万开发者、几千家企业同时在跑这种 Agent 工作流。

140 万亿就是这么来的。

国产大模型的”龙虾时刻”

说到 Agent，国内的大模型厂商也在疯狂转向。

4 月 2 日，阿里发布了 Qwen3.6-Plus。这个模型最大的特点不是参数更多或者跑分更高，而是编程能力和 Agent 能力被大幅强化——它的目标用户已经从”聊天用户”变成了”让 AI 替你干活的开发者”。

4 月 8 日，DeepSeek 上线了专家模式。这是 DeepSeek 走红以来第一次在产品端做模式分层。快速模式给日常聊天用，专家模式给复杂任务用。更值得注意的是，3 月份 DeepSeek 就已经在大量招聘 Agent 相关岗位。

从能聊天，到能干活。整个行业都在做同一件事。

而在海外，全球 Top10 模型的词元消耗量里，中国模型已经占了 61%。在第三方平台 OpenRouter 上，2 月下旬国产 AI 模型的 Token 使用量首次超过美国。MiniMax 的日均 Token 消耗量比去年 12 月暴涨了 6 倍。智谱的 MaaS 平台汇聚了超过 300 万家企业和开发者。

这些数字拼在一起，说的是同一件事：中国的 AI 产业已经从”造模型”阶段进入了”消耗 Token”阶段。就像从造炼油厂进入了烧石油。

微软做了一件有意思的事

3 月 30 日，微软在 365 Copilot 里推了一个新功能叫 Critique。

它的工作方式是这样的：你让 Copilot 帮你做一个研究报告，GPT 先写初稿，然后 Claude 自动审查这份初稿的准确性、完整性和引用质量，审完之后 GPT 再根据 Claude 的意见修改。

你没看错。微软自己的产品里，让 Anthropic 的 Claude 来审查 OpenAI 的 GPT。

微软既是 OpenAI 最大的投资方，也投资了 Anthropic。它在自己的产品里让两家的模型互相检查对方的作业。

DRACO 基准测试显示，这种多模型协作比单模型效果提升了 13.8%。微软还做了个”理事会”机制：多个模型各自独立做研究，最后由一个裁判模型来对比评估。

这件事的信号很明确：单模型时代结束了。

未来的 AI 产品不会只跑一个模型。就像一个公司不会只雇一种人——你需要写手，也需要审校，还需要主编。AI 也一样：一个模型写，一个模型查，一个模型拍板。

而这个过程中，每一步都在消耗 Token。多模型协作意味着同一个任务的 Token 消耗量翻了几倍。

“Token 预算”会出现在你的工资条上

黄仁勋在 GTC 上还说了一句话：Agent 将终结传统 SaaS 模式。未来，”年薪 + Token 预算”将成为职场新标配。

这话乍一听有点科幻。但仔细想想，其实已经在发生了。

我每个月在 Claude 上的花费大概 200 美元。这 200 美元换来的是：我的博客每周能稳定输出 3-4 篇高质量文章，代码项目的开发速度比以前快了至少 3 倍，技术调研的效率完全不在一个量级。

对我来说，这 200 美元不是”订阅费”。它是生产资料。跟买电脑、租工位是一个性质的支出。

推到企业层面也一样。Anthropic 现在有 1000 多家年支出超过 100 万美元的企业客户。这些企业不是在”订阅 AI 服务”，它们是在采购 Token，就像采购电力和带宽。

当 Token 变成了生产资料，它的定价逻辑就会跟石油一样：有现货价、有期货价、有批发价、有分层价。事实上，云厂商已经开始这么干了——阿里云从”卖算力”转向”卖词元”，推出了适配不同场景的词元套餐。

国家数据局局长说的那句话很关键：”词元不仅是智能时代的价值锚点，更是连接技术供给与商业需求的’结算单位’。”

结算单位。这三个字的分量你品一品。人民币是货币的结算单位。千瓦时是电力的结算单位。现在词元要成为 AI 的结算单位。

一个还没有答案的问题

回头看这一个月发生的事——140 万亿日均调用量、黄仁勋喊出”Token 即石油”、微软让 GPT 和 Claude 互审、阿里和 DeepSeek 全面转向 Agent——你会发现 2026 年的 AI 行业跟 2024 年已经完全不是一回事了。

Agent 不是一个新概念。但今年它从 PPT 变成了真金白银。Token 的消耗量是最好的证据。你不会为了聊天烧掉 140 万亿个词元，但你会为了让 AI 替你写代码、做研究、跑流水线烧掉这么多。

我自己从年初开始把大部分工作流搬到了 Agent 上面。写文章、做调研、管代码、生成图片，全部是 Claude Code 在跑。每个月的 Token 账单已经是一笔实实在在的成本。

但我还在想一个没有答案的问题：当每个人都有了自己的 Token 预算，当企业开始像管电费一样管 Token 费，当国家开始像统计 GDP 一样统计日均词元调用量——这个世界的运转方式，会变成什么样？

两年前没人知道”词元”这两个字。现在它在人民日报上有了专版科普，国家数据局在国新办发布会上用它来衡量产业发展水平。

我不确定答案是什么。但我确定一件事：如果你还在把 Token 当成”聊天按字收费”来理解，你已经晚了一步。

参考资料

[[token-140-trillion-national-data-bureau]]
[[nvidia-gtc-2026-token-economics]]
[[microsoft-copilot-multi-model-critique]]