2026 年 4 月 2 日,火山引擎在一场巡展上,扔出了一颗 " 核弹 ":
豆包大模型日均 Token 使用量,突破 120 万亿!
3 个月内翻倍,相比发布时增长了 1000 倍。
同一场发布会上,火山引擎总裁谭待还抛出了一个重要细节:累计 Token 使用量超一万亿的企业客户,已从 2025 年底的约 100 家增至 140 家,短短 3 个月新增了 40 家,这标志着—— AI 已经从 " 免费试用 " 阶段正式进入 " 企业规模化付费 " 阶段。
几乎同一天,智谱 AI 发布上市后首份财报,给出了一个极具冲击力的数字:2025 年全年收入超 7.24 亿元,同比增长 132%;其 MaaSAPI 平台的年度经常性收入(ARR)已突破 17 亿元(约 2.5 亿美元),同比实现 60 倍增长。更关键的是,智谱的平台注册用户已突破 400 万,覆盖全球超过 218 个国家和地区。
而英伟达也没闲着,3 个月内狂砸 60 亿美元,同时投了 Marvell、Lumentum、Coherent 三家,全押在硅光子和 AI 光互联上。
这三件事放在一起,再次释放一个无比强烈的信号:中国 AI 的超级红利期,已经全面到来了。
01
120 万亿 Token,听起来抽象。我们算笔账:
假如平均一次 API 调用消耗 2000Token,120 万亿 ÷ 2000= 每天 6000 亿次调用。
从个人助手到企业服务,从写文案到生成视频,AI 已经从 " 尝鲜工具 " 变成了水电煤一样的基础设施。
更关键的是——这不是免费的狂欢,而是真金白银的付费。
数据显示,累计 Token 使用量超万亿的企业客户,3 个月内从 100 家涨到 140 家;个人用户的 Token 用量,近 1 个月暴增 16 倍。
而智谱在 2026 年一季度逆势将核心模型 API 价格上调 83% 后,平台调用量反而增长了约 400%,呈现出典型的 " 量价齐升 " 态势。
这意味着客户不再为低价买单,而是为 " 能不能完成任务 " 付费。
免费试用→高频付费→涨价不减量,这个商业闭环,彻底跑通了。
为什么 Token 涨得这么疯?
因为 AI 的使用方式,彻底变了。
第一,视频生成,一口吃掉百万 Token。
字节自研的 Seedance2.0,被谭待称为 " 中国第一个毫无争议的全球 SOTA 视频模型 "。2026 年春晚《贺花神》《驭风歌》的视觉特效就是用它生成的。
但伴随爆火的是长达 7 小时的排队,高峰时段排队人数长期保持在 9 万人左右——需求远远超出了供给。
为什么这么火?因为视频生成的 Token 消耗远超文本:生成 1 分钟 720p 视频,需要超过 100 万 Token,是普通文本对话的 100 多倍。
但与传统影视制作相比,Seedance2.0 的性价比简直是降维打击——制作效率较传统模式提升逾一倍,制作成本下降 70%。
按业内测算,整体制作成本有望从过去的万元级降至数千元。
这才是豆包 3 个月 Token 翻倍的真实推手。
第二,智能体,让 AI 从 " 问答 " 变 " 干活 "。
升级后的 ArkClaw(龙虾智能体),不再是聊聊天那么简单。它能对接飞书、微信、钉钉、微博,联动网盘,自主完成信息检索、数据处理、跨工具协作。
一次企业级任务,动辄几十万甚至上百万 Token。
中信证券测算,智能体执行任务时整体 Token 消耗可能提升十倍以上,对应的算力需求得涨百倍以上。这种 " 推理密度 " 的增加,让单次任务的 Token 消耗呈指数级上升。
在 OpenRouter 平台上,超过 70% 的 Token 消耗来自互联网大厂、中大型企业、专业程序员的生产环境。在 100K 到 1MToken 这个区间(智能体工作流最典型的消耗区间),中国模型的调用量遥遥领先。
应用爆发→ Token 增长→模型优化→更多应用。这个正向商业落地循环,真的已经转起来了。
02
很多人问:中国大模型商业化能如此迅猛,凭什么?
答案很简单:成本,低到令人发指的成本!
大模型运营成本里,60%-80% 是电费。中国西部(甘肃、内蒙古、贵州)绿电价格只要 0.13-0.3 元 / 度。在美国呢?0.8-1.2 元 / 度。
光电力一项,中国就比美国便宜 4-5 倍。
如果假设一个大型推理集群年用电量为 100GWh,仅电力一项,中国的年成本约 1150 万美元,美国约 1540 万美元——差出近 400 万美元。
再加上 MoE 架构、极致量化、KV 缓存……推理效率再比美国高 3-10 倍 , 双重降维打击下,中国模型的推理成本被压缩至美国模型的 1/6 至 1/10。
最终体现在 API 定价上(美元 / 百万 Token):
-MiniMaxM2.5:输入 0.3、输出 1.1;
- 智谱 GLM-5:输入 0.3、输出 2.55;
- 通义 Qwen3.5:输入 0.11、输出 0.44;
- 对比 ClaudeOpus4.6:输入 5、输出 25;
这意味着,中国模型成本只有美国巨头的 1/10 到 1/20,甚至更低。

而性能呢?在文本生成、代码、翻译、日常推理等 90% 的高频场景,中国头部模型已经达到 GPT-5、Gemini3 的 95% 以上。
对绝大多数用户来说," 够用、好用、便宜 " 就是全部。中国模型完美踩中了这个点。
于是,全球开发者用脚投票:OpenRouter 平台数据显示,47.17% 的用户是美国本土开发者,中国开发者仅占 6.01%,但中国大模型在该平台的周 Token 调用量占比已达 61%,连续三周超越美国。
更震撼的是调用量排名:在全球前九大模型中,中国占据五席,小米 MiMo-V2-Pro、阶跃星辰 Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2 包揽前四,智谱 GLM-5Turbo 位列第六。
这样的大模型,超级便宜又足够能打,海外市场想要 " 脱钩 "?不存在的。" 成本刚需 " 已经碾碎了所有壁垒。
不过,另一方面,中国 Token 的超级红利,却是 OpenAI、Google、xAI 的压力挑战。
来看几个硬核数据:
OpenAI:ChatGPT 在生成式 AI 网页流量中的份额从 2025 年 1 月的 86.7% 暴跌至 2026 年 1 月的 64.5%,一年跌了 22.2 个百分点。2 月全球月活用户约 5.35 亿,环比下降 6.5%。运营亏损预计将达到 140 亿美元,几乎是前一年的三倍。更讽刺的是,80% 的用户全年交互不足 1000 次——打开率还不如外卖软件。
Google:尽管 Gemini 的份额从 5.7% 涨到了 21.5%,但 AIStudio 开发者流失 25%,被迫推出低价版 GeminiFlash(3 美元 / 百万 Token),但成本仍是中国模型的 3 倍。
xAI:Grok 份额从不足 1% 涨到 3.4%,但 X 平台使用率下滑 40%,性能不及 GPT-5,成本是中国模型的 10 倍,基本与性价比无缘。
未来几年,我们或许会看到,全球 AI 市场正在形成清晰的分层格局:
一边是美国模型守住全球 20% 高端用户,主打国际市场专业推理、品牌溢价、企业安全,然后拿走 80% 收入;
另一边是中国模型拿下全球 80% 大众用户,主打靠薄利多销的普惠、性价比、规模化落地,拿下 20% 收入。
别看这 20% 的收入比例虽小,但放在全球市场,集中在国内少数几家大模型巨头公司上,依旧能让它们吃得满嘴流油。
03
豆包大模型日均 Token 使用量 120 万亿的背后,是算力需求的指数级暴涨的最好验证信号。
传统铜缆互联,在万卡集群中,70% 的算力都浪费在数据传输上。根本扛不住视频、智能体的高带宽需求。
于是硅光子技术,成为当前唯一的解。用光信号替代电信号,带宽提升 10-100 倍,功耗降低 70%,延迟减半。
最近,英伟达对硅光子技术的布局堪称教科书级别:
3 月初:向 Lumentum 和 Coherent 各投 20 亿美元,锁定 CW 激光器、EML 芯片等 1.6T/CPO 时代的核心原材料;
3 月底:再向 Marvell 投 20 亿美元,通过 NVLinkFusion 首次向第三方定制芯片开放互联协议。
30 天内豪掷 60 亿美元,完成了对 AI 算力集群光互联版图的系统性合围。
黄仁勋曾高调明确说过:" 推理转折点已经到来,Token 生成需求激增,全球都在竞相构建人工智能工厂。"
这意味着什么?
光通信(光芯片、光模块、光纤光缆)成为 AI 板块最确定、弹性最大的增量赛道。
据悉,2026 年全球 EML 光芯片需求约 3.5 亿颗,产能仅约 2 亿颗,缺口高达 1.5 亿颗,产能已经排到了 2028 年。
于是我们看到了,从 2025 年至今,在美股、A 股甚至港股,这些赛道里都诞生了大批量的 1 年数倍甚至超十倍的超级大牛股,即使如此,资金依旧疯狂涌入继续推高估值。
因为它们笃定,这里的增量蛋糕,还足够大,足以撑起未来更大的估值叙事。
有人担心:这波红利能持续多久?
我觉得,至少能维持 3-5 年。因为有三道墙,海外的大模型翻不过來:
第一,能源壁垒。" 东数西算 + 西部绿电 " 是全球独有的算电协同体系。美国受地理和能源结构限制,永远复刻不了中国 0.13-0.3 元 / 度的绿电成本。
第二,规模壁垒。Token 调用量越大,单位成本越低。规模→成本→更多规模,正向循环一旦形成,美国模型就被彻底挤出性价比市场。
第三,生态壁垒。中国开源大模型的全球下载量已跃居世界第一。阿里通义千问 Qwen 累计下载超 7 亿次,全球第一;基于中国模型的衍生模型超 18 万个,远超 Google、Meta 总和。全球开发者已经形成了路径依赖,迁移成本极高。
这意味着,至少到 2028 年,中国的大模型都能享受到这一超级巨大的结构性红利。
04 结语
中国日均 Token 调用量从不到 1000 亿到 180 万亿,调用量两年增长超千倍,这样的数据,足够说明一个趋势—— " 一套以 Token 计费为基础的新型商业逻辑正在全球加速演进 "。
Token,是 AI 时代的 " 数字石油 "。而中国大模型,正在成为全球最廉价、最高效的 " 数字石油生产商 "。
1/20 的成本,95% 的性能,120 万亿的日均消耗。
三重优势叠加,让中国 AI 在全球市场势不可挡。
未来 2-3 年,依旧是中国 Token 出海的黄金窗口期。
AI 应用持续爆发,算力与光通信同步兑现业绩,美国巨头持续退守高端,中国大模型全面主导全球普惠 AI 市场。
当廉价高效的中国 Token 覆盖全球每一个角落,AI 的普惠时代,才真正到来。
而中国,将是这场革命的主导者,也是最大的受益者。(全文完)