中国 AI 正在绕过大模型，直奔 Agent 时代

文 | 新芒 X

这不是一场追赶，这是一次换道。

一、那个奥地利程序员帮中国做到了美国人没做到的事

2026 年第一季度，有一个数字震动了整个 AI 行业：中国大模型 Token 日均调用量首次超越美国。

这件事之所以震动，不是因为中国的模型变强了，而是因为超越的方式：不是靠更多的用户，而是靠单个用户消耗量的爆炸性提升。

Agent 应用的普及，让每一个部署了 OpenClaw 实例的用户，每天消耗的 Token 量相当于几百个普通聊天用户。国家数据局的数据呈现了一条近乎垂直的曲线：中国日均 Token 消耗从 2024 年初的约 1000 亿，到 2025 年中突破 30 万亿，到 2026 年 2 月达到 180 万亿。

两年涨了 1800 倍，而驱动最后一段最陡峭的增长的，恰恰是这场 " 龙虾热 "。

但如果只看到这个数字，就看浅了。

真正值得追问的问题是：为什么是中国，在这场 Agent 浪潮里率先完成了大规模商业落地？

在 OpenClaw 出现之前，中国 AI 和美国 AI 的差距，在大多数真正了解行业的人眼里，是明确存在的，不是追上了，而是还在追。为什么偏偏在这个时间节点，中国的商业化速度突然跑到了前面？

这背后，有一条被很多报道忽视了的逻辑链。

二、Anthropic 的封锁，意外成了最好的礼物

OpenClaw 的爆炸，在全球几乎同步发生。但美国和中国对这场爆炸的承接方式，走出了两条完全不同的路线，而分叉点，来自 Anthropic 和谷歌做出的一个决定。

当 OpenClaw 在全球快速扩散之后，Anthropic 很快意识到一个严重的商业模型问题：一个每月付 49 美元 Claude Max 订阅费的用户，如果用 OpenClaw 跑一个 7 × 24 小时的自主 Agent 实例，他消耗的算力，可能相当于几百个普通对话用户一个月的总量。

订阅制定价，根本无法在 Agent 时代维持盈利。于是 Anthropic 宣布：通过个人订阅账号的 OAuth 令牌接入第三方工具，属于违规行为，发现即封号，无缓冲期。谷歌的态度与之类似，内部甚至直接屏蔽了员工访问 OpenClaw。

这个决定从商业逻辑上完全合理，但它产生了一个 Anthropic 自己可能没有充分预料到的连锁反应：它把数以百万计正在寻找稳定、低成本 Agent 后端的开发者，直接推向了中国模型。

从那一刻起，" 用国产模型还是用 Claude 跑 OpenClaw" 就不再是一个纯粹的技术选择，而变成了一个风险管理决策。Anthropic 随时可能封号，ChatGPT 的 API 在高频调用下成本高昂，而 MiniMax M2.5、DeepSeek V3.2、Qwen 等国产模型不仅通过官方 API 明确支持 Agent 高频调用，价格更是只有 Claude Sonnet 的十分之一到二十分之一。

在 OpenRouter 这个全球开发者聚合平台上，这个选择被几百万次地做出，最终呈现为那个历史性的榜单：前五名调用量最高的模型，中国占了四席。

这种逆转不是因为中国模型突然变得比 Claude 更强，而是因为 Agent 时代的竞争维度变了。

在对话式 AI 时代，模型的质量上限决定一切；在 Agent 时代，成本、稳定性、对高频调用的支持程度，跑到了质量前面。这个竞争维度的切换，恰好是中国 AI 的优势区间。

明略科技副总裁李梦林将这件事的实质说得很准确："OpenClaw 的 ' 自带代理 ' 模式，本质上触发了 AI 产业链的一次利益再分配。" 分配的结果，是一部分原本流向海外大厂的 API 收入，在 2026 年第一季度发生了历史上第一次大规模的逆转性迁移。

三、Token 战争的底层逻辑：谁是 AI 时代的水电煤

阿里在 2026 年 3 月做出的那个组织架构调整，现在回头看，是整个 Agent 时代最清醒的战略动作之一。

成立 Alibaba Token Hub（ATH）事业群，与电商、云智能并列，由 CEO 吴泳铭直接带队，整个事业群围绕一件事运转：创造 Token、输送 Token、应用 Token。

这句话说起来像绕口令，但背后是一个极为清晰的产业判断：Token 正在成为 AI 时代的基础能源，就像电力之于工业时代，就像带宽之于互联网时代。

在这个判断下，大模型不再是终点，而是产能设施；云服务不再是存储和计算的租赁，而是 Token 的输配网络；应用产品不再是对话框，而是 Token 的消费终端。整条产业链的价值，最终收敛到一个核心指标：单位 Token 的成本和质量。

这正是中国 AI 在过去两年一直在做却被严重低估的事情。DeepSeek 用 557 万美元训练出 GPT-4 级别的模型，不是技术炫耀，是在给 Token 工厂降低原料成本；

MiniMax M2.5 把 Agent 工具调用能力压缩到 10B 激活参数高效推理，定价 " 每小时 1 美元 "，是在以几乎是成本价的方式抢占基础设施层的市场份额；

Qwen 系列则在多模态与工具调用的兼容性上持续打磨，确保在 OpenClaw 生态里能成为开发者的默认选项之一。

三条路线指向的是同一个目标：在 Agent 时代的 Token 消耗链条里，占据成本最低、供应最稳的那个位置。

这条逻辑链，在 OpenClaw 爆发之前，是一个被少数人相信但很难被大众感知的故事。OpenClaw 的到来，把这个故事从 " 产业洞察 " 变成了 " 当下现实 "，因为 OpenClaw 是一台真实的、高功率运转的 Token 消费机器，它第一次让无数普通用户亲身感受到了 "AI 持续运转 " 和 "Token 持续消耗 " 之间的直接关系。谁能以最低的成本稳定地供给 Token，谁就成为这台机器的首选燃料。

国内另一个不太被注意到的数据，同样印证了这个判断。MiniMax M2.5 发布后 12 小时内登顶 OpenRouter 热度榜，一周内周调用量暴涨至 3.07 万亿 Token，超过 DeepSeek V3.2、GLM-5 等三家模型的总和。这个数字背后的驱动力，几乎全部来自 OpenClaw 生态的高频调用需求。

这意味着什么？意味着中国 AI 的商业化主战场，已经从 " 有多少人打开了这个 App"，跳转到了 " 有多少 Token 在这套基础设施上流动 "。两个指标描述的是完全不同的商业逻辑：前者依赖的是用户粘性和消费习惯，后者依赖的是基础设施的规模效应和成本护城河。后者，才是真正难以被颠覆的竞争优势。

四、大厂战的真相：他们不是在卖龙虾，是在卖铲子

腾讯、阿里、字节、百度在 OpenClaw 热潮里的集体涌入，表面上看起来像是一场跟风，但仔细解剖每一家的动作逻辑，会发现背后藏着一个比 " 跟风 " 深得多的战略。

腾讯在深圳总部举办线下安装会，帮数百名用户把 OpenClaw 部署到 TencentCloud 上。腾讯官方文档写得清楚："OpenClaw 来自开源社区，云应用不收费。" 然后补了一句：" 云服务器和 API 按实际消耗计费。" 这个商业模式，翻译过来就是：用 OpenClaw 的入口流量，喂饱腾讯云的算力和带宽业务。OpenClaw 本身是免费的诱饵，基础设施才是腾讯真正要卖的东西。

阿里的逻辑更赤裸。用户在轻量应用服务器上部署 OpenClaw 后，系统默认配置的是 DeepSeek API，但会自动引导用户前往 " 阿里云百炼大模型控制台 " 创建 API Key，通义千问系列模型的调用费用，从那个 API Key 里出。用户以为自己在用开源工具，但每一次 Agent 的工具调用，都在给阿里云的计量系统加一个计数。

百度直接上线了 " 移动版 OpenClaw"，主打无需本地部署、云端环境隔离更安全，本质上是把 OpenClaw 做成了接入百度云算力的消费入口。字节跳动的 ArkClaw 连本地部署的麻烦都省掉了，做成了纯浏览器端产品，换取的是 ByteDance 火山引擎在每一次 Agent 运行背后的调用份额。

这场竞争里有一句话流传很广，出自 36kr 的一篇分析：" 这就是个卖铲子的生意。OpenClaw 淘金热里，中国大厂要做的，是成为那个向所有淘金者卖铲子的人。" 这个比喻非常准确，但它隐藏了一层更重要的东西：淘金热结束之后，铲子生意不会结束，但淘金者会换地方。真正的护城河，不是谁家的铲子卖得更多，而是谁把自己的算力基础设施做成了淘金者离不开的 " 水和电 "。

这也是为什么阿里成立 ATH 事业群的战略意义远超字面，它意味着阿里不满足于做 OpenClaw 时代的云服务供应商，而是要在下一个技术范式到来之前，把 Token 的生产、分发和消费整个链条攥在自己手里。

一家公司用事业群的层级来定义 "Token"，意味着它相信 Token 会像流量一样，成为这个时代最核心的生产要素。如果这个判断是对的，先建起 Token 基础设施的那家公司，将获得比当年阿里云相对 AWS 更大的先发优势——因为这一次，它连模型都自己造。

五、中国独有的产业化速度，从哪里来

同样是 OpenClaw 热潮，美国的反应和中国的反应有一个结构性的差异，这个差异本身是一个非常值得深思的现象。

在美国，OpenClaw 的爆发主要停留在开发者社区层面，GitHub stars 狂飙、Discord 社群活跃、YCombinator 创始人陈嘉兴和 a16z 的多位合伙人公开宣称自己是狂热粉丝，但大规模的商业化产品、地方政府的扶持政策、数以千计的线下安装服务，并没有以同样的密度和速度出现。

在中国，这些东西几乎是同步爆发的。腾讯的线下活动、深圳无锡的政策补贴、JD.com 的 399 元安装服务、工程师收费 500 元上门部署……这是一个只有在中国市场才会呈现的景观：一项技术产品从开源框架到大众消费产品，从 GitHub 到线下安装摊位，中间的转化时间是以周而非月来计算的。

这种速度背后有几层结构性原因，每一层都比表面看起来更深。

第一层是超级 App 生态的天然适配。OpenClaw 需要接管消息应用来执行任务，而微信、飞书、企业微信恰好是中国职场人几乎所有工作流程的中枢。一个能直接操作微信、读取企业微信消息、在飞书上自动完成审批流的 Agent，在中国语境下的实用价值，远超一个操作 WhatsApp 或 Slack 的西方版本。这不是偶然的功能对齐，而是中国数字化基础设施的高度集中，意外地成了 Agent 落地的最佳土壤。

第二层是极端强烈的降本增效需求。中国经济在过去两年经历的压力，让企业和个人对 " 用更少的人做更多的事 " 有着美国市场难以比拟的迫切性。当一个老板发现可以用 Agent 替代部分外包需求，当一个自媒体人发现可以用 Agent 完成原本需要团队协作的工作流，他们不需要被教育 AI 的价值，他们只需要知道怎么用。这种需求密度，是 OpenClaw 在中国形成 " 安装排队 " 奇观的真实土壤。

第三层，也是最常被低估的一层：中国 AI 产业三年大模型竞争，意外地培养了一批真正懂得如何把 AI 工具变成商业产品的人。那些在 " 百模大战 " 里存活下来的团队，不是靠模型参数赢的，而是靠对中国用户需求的精准理解、对产品落地的执行速度、以及对商业化路径的持续摸索赢的。当 Agent 时代的机会窗口打开，这批人带着已经被磨砺过的产品直觉和执行能力，立刻知道往哪个方向冲。

六、弯道超车的真实边界

但这场胜利，有它真实的边界，而且这个边界比很多人愿意承认的更清晰。

中国赢的这一局，是应用层的商业化速度，不是基础技术的代际领先。

OpenClaw 框架本身是奥地利人写的。底层的大语言模型能力，在复杂推理上的天花板，全球学术界公认仍然是 Claude Opus 和 GPT-5.4 系列更高。中国模型胜出的核心变量是成本和对高频调用的支持，而不是在智能密度上真正超越了对手。在那些需要极高推理能力的任务上，复杂代码重构、高难度科学推断、需要深度上下文理解的多轮决策，绝大多数中国模型仍然建议开发者在关键步骤切换到旗舰海外模型。

这个差距不是永久性的，但它现在是真实存在的。

Agent 生态层面也存在类似的问题。中国迄今为止爆发的这波 Agent 热，在应用场景上高度集中在流程相对标准化的任务：数据整理、内容生产、邮件处理、简单的研究搜集。一旦进入需要真正判断力的非标任务——需要在模糊的信息中做权衡、需要在利益冲突的情况下做选择、需要理解复杂的组织政治——现阶段的 Agent 准确率会急剧下降，而这个下降是中美模型都面临的共同问题，不是专属于中国的短板。

安全隐患则是另一个更紧迫的现实问题。工信部的警告不是在扫兴，而是在指向一个系统性漏洞：当 Agent 拥有了真正的执行能力，它的权限边界就变得极其关键。Cisco 安全团队在测试中发现的那个第三方 OpenClaw 插件，在用户不知情的情况下执行了数据外泄，这不是极端案例，而是权限设计不完善的必然结果。

中国市场 " 先装了再说 " 的速度，在商业化上是优势，在安全治理上则是欠账。这笔账，要么在后续的产品迭代里系统性补上，要么等待一次大规模安全事件来倒逼。

有专家认为：中国企业真正的机会不是做更好的 OpenClaw，而是做 OpenClaw 做不到的事，更懂行业、更深场景、更稳落地。 这句话的潜台词是：OpenClaw 代表的是一种通用 Agent 框架的范式，但通用，意味着它在每一个具体的垂直场景里都没有真正的深度。深度，才是护城河。谁先在金融、医疗、制造、法律等高壁垒场景里建立起可信赖的专用 Agent 系统，谁才能真正把这次的速度优势转化为持久的商业壁垒。

七、这场竞争的真正胜负手，不在技术

如果说大模型时代的竞争是一场军备竞赛，谁的参数更大、谁的 benchmark 更高、谁的训练成本更低。那 Agent 时代的竞争，更像是一场基础设施战争：谁先把 AI 算力变成像水和电一样的公共服务，谁先把 Agent 能力嵌入每一个真实的工作流程，谁先构建起足够规模的可信数据和行业知识壁垒，谁就赢得了这场战争的入场券。

在这个框架下，中国目前领先的那一局，价值是真实的，但它是入场券，不是终局。

OpenClaw 带来的窗口期，核心价值在于它给了中国 AI 产业一个 " 先跑起来 " 的机会，在用户规模、在商业模式验证、在 Token 基础设施的体量上积累起真实的先发优势。

这个验证完成之后，资本和人才会更快速地向 Agent 赛道聚集，而中国 AI 产业在过去三年积累的执行速度和产品打磨能力，会在一个有确定性的赛道里得到最大化的发挥。

但窗口期不会无限延续。OpenAI 没有坐以待毙。GPT-5.4 在 3 月发布时就明确指向了 Agentic 工作流的原生支持，Codex 在企业端的渗透速度告诉市场，OpenAI 没有放弃 Agent 层的控制权。Google Workspace 的 Agent 化整合，有着任何独立产品都难以复制的分发网络优势。微软 Copilot 深度嵌入 Office 生态，面向的是中国大厂触达不到的数亿企业用户。

这场竞争的真实胜负，最终会在三年后的某个时间节点变得清晰——那时候，谁在真正高价值的垂直场景里建立起了不可替代的 Agent 基础设施，谁就赢了这场从大模型到 Agent 的换道赛。技术差距会缩小，成本优势会被追平，但那时候已经建立起来的用户信任、数据护城河和行业深度，才是真正的壁垒。

2025 年还是 " 千模混战 "，2026 年主战场已全面转向智能体。这个判断现在已经是共识，但共识从来不是终点，而是下一轮竞争的起跑线。

中国 AI 目前站在这条线的前面，但不是很多。

数据来源：

第一财经、《每日经济新闻》、CNBC、Fortune、36kr、国家数据局、华泰柏瑞基金、OpenRouter 公开数据、明略科技、CEIBS 中欧国际工商学院 | 数据截至 2026 年 4 月

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

中国 AI 正在绕过大模型，直奔 Agent 时代

宙世代

一起剪

相关阅读

黄仁勋现身美国海底捞！与网友合影还送签名：盘点AI教父吃火锅名场面

被网友吹上天的名人AI，一开口我就知道是个水货。

佳能发布40厘米巨无霸镜头：1200mm超长焦距：升级30倍变焦

从看过去到看未来：上海农商银行助力产业链强链补链的科技金融实践

扎克伯格亲自下场写代码 把办公桌搬进Meta AI实验室

专访中国工业互联网研究院院长鲁春丛：推进工业智能应用 “七分在数据、三分在模型”

具身智能机器人企业 集体冲向百亿估值

科技基金调仓动向曝光 AI电力、光通信、半导体获加仓

瞄准实战 中公教育加速布局“AI+职业教育”

微软接手OpenAI挪威“星际之门”项目 租用3万枚英伟达芯片

快手马宏彬：以 AI 驱动“数字新市井”，共建有价值有温度的视听生态

AI短剧“盗脸”终被“打脸”

微短剧告别“草莽时代”，黄晓明张凯丽等探讨微短剧未来

给“人造太阳”装上大脑，是一门什么样的生意？

最新评论

钛媒体

热门推荐

企业资讯

扎克伯格亲自下场写代码把办公桌搬进Meta AI实验室

具身智能机器人企业集体冲向百亿估值

瞄准实战中公教育加速布局“AI+职业教育”

微软接手OpenAI挪威“星际之门”项目租用3万枚英伟达芯片