2026 年,Token 变成了石油

cover

大家好,我是飞飞。

上个月国家数据局开了个发布会,里面有一组数字让我停下来想了很久。

我国日均词元调用量已经突破 140 万亿。2024 年初是 1000 亿。两年,涨了 1000 多倍。

“日均词元调用量 140 万亿”——这个句式你熟悉吗?它跟”日产粗钢 300 万吨”是一个语感。当一个技术概念开始用这种句式来汇报的时候,它就不再是技术概念了。它变成了工业产能。

同一个月,黄仁勋在 GTC 2026 上说了一句话:”Token is the new commodity。” Token 是新的大宗商品。

大宗商品是什么?石油、钢铁、铜。用来造东西的原材料。你不会直接消费它,但你消费的一切都离不开它。

黄仁勋的意思是:Token 就是 AI 时代的石油。

为什么突然涨了 1000 倍

2024 年的时候,我们用大模型主要干一件事:聊天。你问一句,它答一句,消耗几百个 Token,一轮对话下来可能几千个。

但 2026 年不一样了。现在大模型开始”干活”了。

今年初 OpenClaw 爆火,带着整个 Agent(智能体)生态起飞。Agent 跟聊天最大的区别是:聊天是你问一句它答一句,Agent 是你下一个指令,它自己规划、拆解、调工具、执行,中间可能调用几十次模型,消耗的 Token 量是普通对话的几百倍。

我自己的博客写作流水线就是个例子。我说一句”帮我写一篇关于 Anthropic 营收的文章”,Claude Code 会自己搜索资料、抓取网页、整理素材、写初稿、检测 AI 味、修改、生成封面图、转成公众号和小红书版本。整个流程下来,消耗的 Token 数量是我手动聊天的几百倍。

这还只是一个人、一篇文章。想象一下几百万开发者、几千家企业同时在跑这种 Agent 工作流。

140 万亿就是这么来的。

国产大模型的”龙虾时刻”

说到 Agent,国内的大模型厂商也在疯狂转向。

4 月 2 日,阿里发布了 Qwen3.6-Plus。这个模型最大的特点不是参数更多或者跑分更高,而是编程能力和 Agent 能力被大幅强化——它的目标用户已经从”聊天用户”变成了”让 AI 替你干活的开发者”。

4 月 8 日,DeepSeek 上线了专家模式。这是 DeepSeek 走红以来第一次在产品端做模式分层。快速模式给日常聊天用,专家模式给复杂任务用。更值得注意的是,3 月份 DeepSeek 就已经在大量招聘 Agent 相关岗位。

从能聊天,到能干活。整个行业都在做同一件事。

而在海外,全球 Top10 模型的词元消耗量里,中国模型已经占了 61%。在第三方平台 OpenRouter 上,2 月下旬国产 AI 模型的 Token 使用量首次超过美国。MiniMax 的日均 Token 消耗量比去年 12 月暴涨了 6 倍。智谱的 MaaS 平台汇聚了超过 300 万家企业和开发者。

这些数字拼在一起,说的是同一件事:中国的 AI 产业已经从”造模型”阶段进入了”消耗 Token”阶段。就像从造炼油厂进入了烧石油。

微软做了一件有意思的事

3 月 30 日,微软在 365 Copilot 里推了一个新功能叫 Critique。

它的工作方式是这样的:你让 Copilot 帮你做一个研究报告,GPT 先写初稿,然后 Claude 自动审查这份初稿的准确性、完整性和引用质量,审完之后 GPT 再根据 Claude 的意见修改。

你没看错。微软自己的产品里,让 Anthropic 的 Claude 来审查 OpenAI 的 GPT。

微软既是 OpenAI 最大的投资方,也投资了 Anthropic。它在自己的产品里让两家的模型互相检查对方的作业。

DRACO 基准测试显示,这种多模型协作比单模型效果提升了 13.8%。微软还做了个”理事会”机制:多个模型各自独立做研究,最后由一个裁判模型来对比评估。

这件事的信号很明确:单模型时代结束了。

未来的 AI 产品不会只跑一个模型。就像一个公司不会只雇一种人——你需要写手,也需要审校,还需要主编。AI 也一样:一个模型写,一个模型查,一个模型拍板。

而这个过程中,每一步都在消耗 Token。多模型协作意味着同一个任务的 Token 消耗量翻了几倍。

“Token 预算”会出现在你的工资条上

黄仁勋在 GTC 上还说了一句话:Agent 将终结传统 SaaS 模式。未来,”年薪 + Token 预算”将成为职场新标配。

这话乍一听有点科幻。但仔细想想,其实已经在发生了。

我每个月在 Claude 上的花费大概 200 美元。这 200 美元换来的是:我的博客每周能稳定输出 3-4 篇高质量文章,代码项目的开发速度比以前快了至少 3 倍,技术调研的效率完全不在一个量级。

对我来说,这 200 美元不是”订阅费”。它是生产资料。跟买电脑、租工位是一个性质的支出。

推到企业层面也一样。Anthropic 现在有 1000 多家年支出超过 100 万美元的企业客户。这些企业不是在”订阅 AI 服务”,它们是在采购 Token,就像采购电力和带宽。

当 Token 变成了生产资料,它的定价逻辑就会跟石油一样:有现货价、有期货价、有批发价、有分层价。事实上,云厂商已经开始这么干了——阿里云从”卖算力”转向”卖词元”,推出了适配不同场景的词元套餐。

国家数据局局长说的那句话很关键:”词元不仅是智能时代的价值锚点,更是连接技术供给与商业需求的’结算单位’。”

结算单位。这三个字的分量你品一品。人民币是货币的结算单位。千瓦时是电力的结算单位。现在词元要成为 AI 的结算单位。

一个还没有答案的问题

回头看这一个月发生的事——140 万亿日均调用量、黄仁勋喊出”Token 即石油”、微软让 GPT 和 Claude 互审、阿里和 DeepSeek 全面转向 Agent——你会发现 2026 年的 AI 行业跟 2024 年已经完全不是一回事了。

Agent 不是一个新概念。但今年它从 PPT 变成了真金白银。Token 的消耗量是最好的证据。你不会为了聊天烧掉 140 万亿个词元,但你会为了让 AI 替你写代码、做研究、跑流水线烧掉这么多。

我自己从年初开始把大部分工作流搬到了 Agent 上面。写文章、做调研、管代码、生成图片,全部是 Claude Code 在跑。每个月的 Token 账单已经是一笔实实在在的成本。

但我还在想一个没有答案的问题:当每个人都有了自己的 Token 预算,当企业开始像管电费一样管 Token 费,当国家开始像统计 GDP 一样统计日均词元调用量——这个世界的运转方式,会变成什么样?

两年前没人知道”词元”这两个字。现在它在人民日报上有了专版科普,国家数据局在国新办发布会上用它来衡量产业发展水平。

我不确定答案是什么。但我确定一件事:如果你还在把 Token 当成”聊天按字收费”来理解,你已经晚了一步。


参考资料

  • [[token-140-trillion-national-data-bureau]]
  • [[nvidia-gtc-2026-token-economics]]
  • [[microsoft-copilot-multi-model-critique]]

相关洞察

  • [[2026-agent-year-token-economy-insights]]