120 万亿 Token！中国 AI，正在“卷”死美国

2026 年 4 月 2 日，火山引擎在一场巡展上，扔出了一颗 " 核弹 "：

豆包大模型日均 Token 使用量，突破 120 万亿！

3 个月内翻倍，相比发布时增长了 1000 倍。

同一场发布会上，火山引擎总裁谭待还抛出了一个重要细节：累计 Token 使用量超一万亿的企业客户，已从 2025 年底的约 100 家增至 140 家，短短 3 个月新增了 40 家，这标志着—— AI 已经从 " 免费试用 " 阶段正式进入 " 企业规模化付费 " 阶段。

几乎同一天，智谱 AI 发布上市后首份财报，给出了一个极具冲击力的数字：2025 年全年收入超 7.24 亿元，同比增长 132%；其 MaaSAPI 平台的年度经常性收入（ARR）已突破 17 亿元（约 2.5 亿美元），同比实现 60 倍增长。更关键的是，智谱的平台注册用户已突破 400 万，覆盖全球超过 218 个国家和地区。

而英伟达也没闲着，3 个月内狂砸 60 亿美元，同时投了 Marvell、Lumentum、Coherent 三家，全押在硅光子和 AI 光互联上。

这三件事放在一起，再次释放一个无比强烈的信号：中国 AI 的超级红利期，已经全面到来了。

120 万亿 Token，听起来抽象。我们算笔账：

假如平均一次 API 调用消耗 2000Token，120 万亿 ÷ 2000= 每天 6000 亿次调用。

从个人助手到企业服务，从写文案到生成视频，AI 已经从 " 尝鲜工具 " 变成了水电煤一样的基础设施。

更关键的是——这不是免费的狂欢，而是真金白银的付费。

数据显示，累计 Token 使用量超万亿的企业客户，3 个月内从 100 家涨到 140 家；个人用户的 Token 用量，近 1 个月暴增 16 倍。

而智谱在 2026 年一季度逆势将核心模型 API 价格上调 83% 后，平台调用量反而增长了约 400%，呈现出典型的 " 量价齐升 " 态势。

这意味着客户不再为低价买单，而是为 " 能不能完成任务 " 付费。

免费试用→高频付费→涨价不减量，这个商业闭环，彻底跑通了。

为什么 Token 涨得这么疯？

因为 AI 的使用方式，彻底变了。

第一，视频生成，一口吃掉百万 Token。

字节自研的 Seedance2.0，被谭待称为 " 中国第一个毫无争议的全球 SOTA 视频模型 "。2026 年春晚《贺花神》《驭风歌》的视觉特效就是用它生成的。

但伴随爆火的是长达 7 小时的排队，高峰时段排队人数长期保持在 9 万人左右——需求远远超出了供给。

为什么这么火？因为视频生成的 Token 消耗远超文本：生成 1 分钟 720p 视频，需要超过 100 万 Token，是普通文本对话的 100 多倍。

但与传统影视制作相比，Seedance2.0 的性价比简直是降维打击——制作效率较传统模式提升逾一倍，制作成本下降 70%。

按业内测算，整体制作成本有望从过去的万元级降至数千元。

这才是豆包 3 个月 Token 翻倍的真实推手。

第二，智能体，让 AI 从 " 问答 " 变 " 干活 "。

升级后的 ArkClaw（龙虾智能体），不再是聊聊天那么简单。它能对接飞书、微信、钉钉、微博，联动网盘，自主完成信息检索、数据处理、跨工具协作。

一次企业级任务，动辄几十万甚至上百万 Token。

中信证券测算，智能体执行任务时整体 Token 消耗可能提升十倍以上，对应的算力需求得涨百倍以上。这种 " 推理密度 " 的增加，让单次任务的 Token 消耗呈指数级上升。

在 OpenRouter 平台上，超过 70% 的 Token 消耗来自互联网大厂、中大型企业、专业程序员的生产环境。在 100K 到 1MToken 这个区间（智能体工作流最典型的消耗区间），中国模型的调用量遥遥领先。

应用爆发→ Token 增长→模型优化→更多应用。这个正向商业落地循环，真的已经转起来了。

很多人问：中国大模型商业化能如此迅猛，凭什么？

答案很简单：成本，低到令人发指的成本！

大模型运营成本里，60%-80% 是电费。中国西部（甘肃、内蒙古、贵州）绿电价格只要 0.13-0.3 元 / 度。在美国呢？0.8-1.2 元 / 度。

光电力一项，中国就比美国便宜 4-5 倍。

如果假设一个大型推理集群年用电量为 100GWh，仅电力一项，中国的年成本约 1150 万美元，美国约 1540 万美元——差出近 400 万美元。

再加上 MoE 架构、极致量化、KV 缓存……推理效率再比美国高 3-10 倍 , 双重降维打击下，中国模型的推理成本被压缩至美国模型的 1/6 至 1/10。

最终体现在 API 定价上（美元 / 百万 Token）：

-MiniMaxM2.5：输入 0.3、输出 1.1；

- 智谱 GLM-5：输入 0.3、输出 2.55；

- 通义 Qwen3.5：输入 0.11、输出 0.44；

- 对比 ClaudeOpus4.6：输入 5、输出 25；

这意味着，中国模型成本只有美国巨头的 1/10 到 1/20，甚至更低。

形同天堑一样的差距。

而性能呢？在文本生成、代码、翻译、日常推理等 90% 的高频场景，中国头部模型已经达到 GPT-5、Gemini3 的 95% 以上。

对绝大多数用户来说，" 够用、好用、便宜 " 就是全部。中国模型完美踩中了这个点。

于是，全球开发者用脚投票：OpenRouter 平台数据显示，47.17% 的用户是美国本土开发者，中国开发者仅占 6.01%，但中国大模型在该平台的周 Token 调用量占比已达 61%，连续三周超越美国。

更震撼的是调用量排名：在全球前九大模型中，中国占据五席，小米 MiMo-V2-Pro、阶跃星辰 Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2 包揽前四，智谱 GLM-5Turbo 位列第六。

这样的大模型，超级便宜又足够能打，海外市场想要 " 脱钩 "？不存在的。" 成本刚需 " 已经碾碎了所有壁垒。

不过，另一方面，中国 Token 的超级红利，却是 OpenAI、Google、xAI 的压力挑战。

来看几个硬核数据：

OpenAI：ChatGPT 在生成式 AI 网页流量中的份额从 2025 年 1 月的 86.7% 暴跌至 2026 年 1 月的 64.5%，一年跌了 22.2 个百分点。2 月全球月活用户约 5.35 亿，环比下降 6.5%。运营亏损预计将达到 140 亿美元，几乎是前一年的三倍。更讽刺的是，80% 的用户全年交互不足 1000 次——打开率还不如外卖软件。

Google：尽管 Gemini 的份额从 5.7% 涨到了 21.5%，但 AIStudio 开发者流失 25%，被迫推出低价版 GeminiFlash（3 美元 / 百万 Token），但成本仍是中国模型的 3 倍。

xAI：Grok 份额从不足 1% 涨到 3.4%，但 X 平台使用率下滑 40%，性能不及 GPT-5，成本是中国模型的 10 倍，基本与性价比无缘。

未来几年，我们或许会看到，全球 AI 市场正在形成清晰的分层格局：

一边是美国模型守住全球 20% 高端用户，主打国际市场专业推理、品牌溢价、企业安全，然后拿走 80% 收入；

另一边是中国模型拿下全球 80% 大众用户，主打靠薄利多销的普惠、性价比、规模化落地，拿下 20% 收入。

别看这 20% 的收入比例虽小，但放在全球市场，集中在国内少数几家大模型巨头公司上，依旧能让它们吃得满嘴流油。

豆包大模型日均 Token 使用量 120 万亿的背后，是算力需求的指数级暴涨的最好验证信号。

传统铜缆互联，在万卡集群中，70% 的算力都浪费在数据传输上。根本扛不住视频、智能体的高带宽需求。

于是硅光子技术，成为当前唯一的解。用光信号替代电信号，带宽提升 10-100 倍，功耗降低 70%，延迟减半。

最近，英伟达对硅光子技术的布局堪称教科书级别：

3 月初：向 Lumentum 和 Coherent 各投 20 亿美元，锁定 CW 激光器、EML 芯片等 1.6T/CPO 时代的核心原材料；

3 月底：再向 Marvell 投 20 亿美元，通过 NVLinkFusion 首次向第三方定制芯片开放互联协议。

30 天内豪掷 60 亿美元，完成了对 AI 算力集群光互联版图的系统性合围。

黄仁勋曾高调明确说过：" 推理转折点已经到来，Token 生成需求激增，全球都在竞相构建人工智能工厂。"

这意味着什么？

光通信（光芯片、光模块、光纤光缆）成为 AI 板块最确定、弹性最大的增量赛道。

据悉，2026 年全球 EML 光芯片需求约 3.5 亿颗，产能仅约 2 亿颗，缺口高达 1.5 亿颗，产能已经排到了 2028 年。

于是我们看到了，从 2025 年至今，在美股、A 股甚至港股，这些赛道里都诞生了大批量的 1 年数倍甚至超十倍的超级大牛股，即使如此，资金依旧疯狂涌入继续推高估值。

因为它们笃定，这里的增量蛋糕，还足够大，足以撑起未来更大的估值叙事。

有人担心：这波红利能持续多久？

我觉得，至少能维持 3-5 年。因为有三道墙，海外的大模型翻不过來：

第一，能源壁垒。" 东数西算 + 西部绿电 " 是全球独有的算电协同体系。美国受地理和能源结构限制，永远复刻不了中国 0.13-0.3 元 / 度的绿电成本。

第二，规模壁垒。Token 调用量越大，单位成本越低。规模→成本→更多规模，正向循环一旦形成，美国模型就被彻底挤出性价比市场。

第三，生态壁垒。中国开源大模型的全球下载量已跃居世界第一。阿里通义千问 Qwen 累计下载超 7 亿次，全球第一；基于中国模型的衍生模型超 18 万个，远超 Google、Meta 总和。全球开发者已经形成了路径依赖，迁移成本极高。

这意味着，至少到 2028 年，中国的大模型都能享受到这一超级巨大的结构性红利。

04 结语

中国日均 Token 调用量从不到 1000 亿到 180 万亿，调用量两年增长超千倍，这样的数据，足够说明一个趋势—— " 一套以 Token 计费为基础的新型商业逻辑正在全球加速演进 "。

Token，是 AI 时代的 " 数字石油 "。而中国大模型，正在成为全球最廉价、最高效的 " 数字石油生产商 "。

1/20 的成本，95% 的性能，120 万亿的日均消耗。

三重优势叠加，让中国 AI 在全球市场势不可挡。

未来 2-3 年，依旧是中国 Token 出海的黄金窗口期。

AI 应用持续爆发，算力与光通信同步兑现业绩，美国巨头持续退守高端，中国大模型全面主导全球普惠 AI 市场。

当廉价高效的中国 Token 覆盖全球每一个角落，AI 的普惠时代，才真正到来。

而中国，将是这场革命的主导者，也是最大的受益者。（全文完）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

120 万亿 Token！中国 AI，正在“卷”死美国

宙世代

一起剪

相关阅读

中国银河杨超论A股：短期“稳”于高股息，长期“进”在科技成长

业内人士澄清管制光伏设备出口，光伏设备板块拉升

中国银河杨超：黄金避险属性未减弱，当前波动是定价逻辑短期调整

刚刚！国际油价飙涨8% 黄金跌破4700美元

两市ETF两融余额减少8.2亿元

我国复用航天器关键部件研制成功，航空航天ETF天弘（159241）近5日资金净流入累超6300万元

香港金融管理局发出首批稳定币发行人牌照，证券ETF天弘（159841）近20日资金净流入累超2.6亿元，机构：看好券商配置性价比

智元发布世界模型Genie Envisioner 2.0，机器人ETF天弘(159770)上周五获申购超1000万份，居深市同标的第一

电车才能改变世界！崔东树：世界汽车市场特征是穷人没有车 富人才有车

一汽高管：卖一辆车亏两三万块钱 中国本土企业难道永远在国内互相厮杀吗

国际油价飙涨8%，黄金跌破4650美元

布伦特原油期货涨幅扩大至8%

多种因素叠加影响产品供应，a2公司调整财年展望预计两位数增长

和讯信息史华伟：短期压力位 关注优质成长

和讯信息李永熙：上方仅剩3986缺口，4000点将直接突破

最新评论

格隆汇

热门推荐

企业资讯

电车才能改变世界！崔东树：世界汽车市场特征是穷人没有车富人才有车

一汽高管：卖一辆车亏两三万块钱中国本土企业难道永远在国内互相厮杀吗

和讯信息史华伟：短期压力位关注优质成长