关于ZAKER 合作
格隆汇 22小时前

120 万亿 Token!中国 AI,正在“卷”死美国

2026 年 4 月 2 日,火山引擎在一场巡展上,扔出了一颗 " 核弹 ":

豆包大模型日均 Token 使用量,突破 120 万亿!

3 个月内翻倍,相比发布时增长了 1000 倍。

同一场发布会上,火山引擎总裁谭待还抛出了一个重要细节:累计 Token 使用量超一万亿的企业客户,已从 2025 年底的约 100 家增至 140 家,短短 3 个月新增了 40 家,这标志着—— AI 已经从 " 免费试用 " 阶段正式进入 " 企业规模化付费 " 阶段。

几乎同一天,智谱 AI 发布上市后首份财报,给出了一个极具冲击力的数字:2025 年全年收入超 7.24 亿元,同比增长 132%;其 MaaSAPI 平台的年度经常性收入(ARR)已突破 17 亿元(约 2.5 亿美元),同比实现 60 倍增长。更关键的是,智谱的平台注册用户已突破 400 万,覆盖全球超过 218 个国家和地区。

而英伟达也没闲着,3 个月内狂砸 60 亿美元,同时投了 Marvell、Lumentum、Coherent 三家,全押在硅光子和 AI 光互联上。

这三件事放在一起,再次释放一个无比强烈的信号:中国 AI 的超级红利期,已经全面到来了。

01

120 万亿 Token,听起来抽象。我们算笔账:

假如平均一次 API 调用消耗 2000Token,120 万亿 ÷ 2000= 每天 6000 亿次调用。

从个人助手到企业服务,从写文案到生成视频,AI 已经从 " 尝鲜工具 " 变成了水电煤一样的基础设施。

更关键的是——这不是免费的狂欢,而是真金白银的付费。

数据显示,累计 Token 使用量超万亿的企业客户,3 个月内从 100 家涨到 140 家;个人用户的 Token 用量,近 1 个月暴增 16 倍。

而智谱在 2026 年一季度逆势将核心模型 API 价格上调 83% 后,平台调用量反而增长了约 400%,呈现出典型的 " 量价齐升 " 态势。

这意味着客户不再为低价买单,而是为 " 能不能完成任务 " 付费。

免费试用→高频付费→涨价不减量,这个商业闭环,彻底跑通了。

为什么 Token 涨得这么疯?

因为 AI 的使用方式,彻底变了。

第一,视频生成,一口吃掉百万 Token。

字节自研的 Seedance2.0,被谭待称为 " 中国第一个毫无争议的全球 SOTA 视频模型 "。2026 年春晚《贺花神》《驭风歌》的视觉特效就是用它生成的。

但伴随爆火的是长达 7 小时的排队,高峰时段排队人数长期保持在 9 万人左右——需求远远超出了供给。

为什么这么火?因为视频生成的 Token 消耗远超文本:生成 1 分钟 720p 视频,需要超过 100 万 Token,是普通文本对话的 100 多倍。

但与传统影视制作相比,Seedance2.0 的性价比简直是降维打击——制作效率较传统模式提升逾一倍,制作成本下降 70%。

按业内测算,整体制作成本有望从过去的万元级降至数千元。

这才是豆包 3 个月 Token 翻倍的真实推手。

第二,智能体,让 AI 从 " 问答 " 变 " 干活 "。

升级后的 ArkClaw(龙虾智能体),不再是聊聊天那么简单。它能对接飞书、微信、钉钉、微博,联动网盘,自主完成信息检索、数据处理、跨工具协作。

一次企业级任务,动辄几十万甚至上百万 Token。

中信证券测算,智能体执行任务时整体 Token 消耗可能提升十倍以上,对应的算力需求得涨百倍以上。这种 " 推理密度 " 的增加,让单次任务的 Token 消耗呈指数级上升。

在 OpenRouter 平台上,超过 70% 的 Token 消耗来自互联网大厂、中大型企业、专业程序员的生产环境。在 100K 到 1MToken 这个区间(智能体工作流最典型的消耗区间),中国模型的调用量遥遥领先。

应用爆发→ Token 增长→模型优化→更多应用。这个正向商业落地循环,真的已经转起来了。

02

很多人问:中国大模型商业化能如此迅猛,凭什么?

答案很简单:成本,低到令人发指的成本!

大模型运营成本里,60%-80% 是电费。中国西部(甘肃、内蒙古、贵州)绿电价格只要 0.13-0.3 元 / 度。在美国呢?0.8-1.2 元 / 度。

光电力一项,中国就比美国便宜 4-5 倍。

如果假设一个大型推理集群年用电量为 100GWh,仅电力一项,中国的年成本约 1150 万美元,美国约 1540 万美元——差出近 400 万美元。

再加上 MoE 架构、极致量化、KV 缓存……推理效率再比美国高 3-10 倍 , 双重降维打击下,中国模型的推理成本被压缩至美国模型的 1/6 至 1/10。

最终体现在 API 定价上(美元 / 百万 Token):

-MiniMaxM2.5:输入 0.3、输出 1.1;

- 智谱 GLM-5:输入 0.3、输出 2.55;

- 通义 Qwen3.5:输入 0.11、输出 0.44;

- 对比 ClaudeOpus4.6:输入 5、输出 25;

这意味着,中国模型成本只有美国巨头的 1/10 到 1/20,甚至更低。

形同天堑一样的差距。

而性能呢?在文本生成、代码、翻译、日常推理等 90% 的高频场景,中国头部模型已经达到 GPT-5、Gemini3 的 95% 以上。

对绝大多数用户来说," 够用、好用、便宜 " 就是全部。中国模型完美踩中了这个点。

于是,全球开发者用脚投票:OpenRouter 平台数据显示,47.17% 的用户是美国本土开发者,中国开发者仅占 6.01%,但中国大模型在该平台的周 Token 调用量占比已达 61%,连续三周超越美国。

更震撼的是调用量排名:在全球前九大模型中,中国占据五席,小米 MiMo-V2-Pro、阶跃星辰 Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2 包揽前四,智谱 GLM-5Turbo 位列第六。

这样的大模型,超级便宜又足够能打,海外市场想要 " 脱钩 "?不存在的。" 成本刚需 " 已经碾碎了所有壁垒。

不过,另一方面,中国 Token 的超级红利,却是 OpenAI、Google、xAI 的压力挑战。

来看几个硬核数据:

OpenAI:ChatGPT 在生成式 AI 网页流量中的份额从 2025 年 1 月的 86.7% 暴跌至 2026 年 1 月的 64.5%,一年跌了 22.2 个百分点。2 月全球月活用户约 5.35 亿,环比下降 6.5%。运营亏损预计将达到 140 亿美元,几乎是前一年的三倍。更讽刺的是,80% 的用户全年交互不足 1000 次——打开率还不如外卖软件。

Google:尽管 Gemini 的份额从 5.7% 涨到了 21.5%,但 AIStudio 开发者流失 25%,被迫推出低价版 GeminiFlash(3 美元 / 百万 Token),但成本仍是中国模型的 3 倍。

xAI:Grok 份额从不足 1% 涨到 3.4%,但 X 平台使用率下滑 40%,性能不及 GPT-5,成本是中国模型的 10 倍,基本与性价比无缘。

未来几年,我们或许会看到,全球 AI 市场正在形成清晰的分层格局:

一边是美国模型守住全球 20% 高端用户,主打国际市场专业推理、品牌溢价、企业安全,然后拿走 80% 收入;

另一边是中国模型拿下全球 80% 大众用户,主打靠薄利多销的普惠、性价比、规模化落地,拿下 20% 收入。

别看这 20% 的收入比例虽小,但放在全球市场,集中在国内少数几家大模型巨头公司上,依旧能让它们吃得满嘴流油。

03

豆包大模型日均 Token 使用量 120 万亿的背后,是算力需求的指数级暴涨的最好验证信号。

传统铜缆互联,在万卡集群中,70% 的算力都浪费在数据传输上。根本扛不住视频、智能体的高带宽需求。

于是硅光子技术,成为当前唯一的解。用光信号替代电信号,带宽提升 10-100 倍,功耗降低 70%,延迟减半。

最近,英伟达对硅光子技术的布局堪称教科书级别:

3 月初:向 Lumentum 和 Coherent 各投 20 亿美元,锁定 CW 激光器、EML 芯片等 1.6T/CPO 时代的核心原材料;

3 月底:再向 Marvell 投 20 亿美元,通过 NVLinkFusion 首次向第三方定制芯片开放互联协议。

30 天内豪掷 60 亿美元,完成了对 AI 算力集群光互联版图的系统性合围。

黄仁勋曾高调明确说过:" 推理转折点已经到来,Token 生成需求激增,全球都在竞相构建人工智能工厂。"

这意味着什么?

光通信(光芯片、光模块、光纤光缆)成为 AI 板块最确定、弹性最大的增量赛道。

据悉,2026 年全球 EML 光芯片需求约 3.5 亿颗,产能仅约 2 亿颗,缺口高达 1.5 亿颗,产能已经排到了 2028 年。

于是我们看到了,从 2025 年至今,在美股、A 股甚至港股,这些赛道里都诞生了大批量的 1 年数倍甚至超十倍的超级大牛股,即使如此,资金依旧疯狂涌入继续推高估值。

因为它们笃定,这里的增量蛋糕,还足够大,足以撑起未来更大的估值叙事。

有人担心:这波红利能持续多久?

我觉得,至少能维持 3-5 年。因为有三道墙,海外的大模型翻不过來:

第一,能源壁垒。" 东数西算 + 西部绿电 " 是全球独有的算电协同体系。美国受地理和能源结构限制,永远复刻不了中国 0.13-0.3 元 / 度的绿电成本。

第二,规模壁垒。Token 调用量越大,单位成本越低。规模→成本→更多规模,正向循环一旦形成,美国模型就被彻底挤出性价比市场。

第三,生态壁垒。中国开源大模型的全球下载量已跃居世界第一。阿里通义千问 Qwen 累计下载超 7 亿次,全球第一;基于中国模型的衍生模型超 18 万个,远超 Google、Meta 总和。全球开发者已经形成了路径依赖,迁移成本极高。

这意味着,至少到 2028 年,中国的大模型都能享受到这一超级巨大的结构性红利。

04 结语

中国日均 Token 调用量从不到 1000 亿到 180 万亿,调用量两年增长超千倍,这样的数据,足够说明一个趋势—— " 一套以 Token 计费为基础的新型商业逻辑正在全球加速演进 "。

Token,是 AI 时代的 " 数字石油 "。而中国大模型,正在成为全球最廉价、最高效的 " 数字石油生产商 "。

1/20 的成本,95% 的性能,120 万亿的日均消耗。

三重优势叠加,让中国 AI 在全球市场势不可挡。

未来 2-3 年,依旧是中国 Token 出海的黄金窗口期。

AI 应用持续爆发,算力与光通信同步兑现业绩,美国巨头持续退守高端,中国大模型全面主导全球普惠 AI 市场。

当廉价高效的中国 Token 覆盖全球每一个角落,AI 的普惠时代,才真正到来。

而中国,将是这场革命的主导者,也是最大的受益者。(全文完)

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容