关于ZAKER 合作
钛媒体 21小时前

中国 AI 正在绕过大模型,直奔 Agent 时代

文 | 新芒 X

这不是一场追赶,这是一次换道。

一、那个奥地利程序员帮中国做到了美国人没做到的事

2026 年第一季度,有一个数字震动了整个 AI 行业:中国大模型 Token 日均调用量首次超越美国

这件事之所以震动,不是因为中国的模型变强了,而是因为超越的方式:不是靠更多的用户,而是靠单个用户消耗量的爆炸性提升。

Agent 应用的普及,让每一个部署了 OpenClaw 实例的用户,每天消耗的 Token 量相当于几百个普通聊天用户。国家数据局的数据呈现了一条近乎垂直的曲线:中国日均 Token 消耗从 2024 年初的约 1000 亿,到 2025 年中突破 30 万亿,到 2026 年 2 月达到 180 万亿。

两年涨了 1800 倍,而驱动最后一段最陡峭的增长的,恰恰是这场 " 龙虾热 "。

但如果只看到这个数字,就看浅了。

真正值得追问的问题是:为什么是中国,在这场 Agent 浪潮里率先完成了大规模商业落地?

在 OpenClaw 出现之前,中国 AI 和美国 AI 的差距,在大多数真正了解行业的人眼里,是明确存在的,不是追上了,而是还在追。为什么偏偏在这个时间节点,中国的商业化速度突然跑到了前面?

这背后,有一条被很多报道忽视了的逻辑链。

二、Anthropic 的封锁,意外成了最好的礼物

OpenClaw 的爆炸,在全球几乎同步发生。但美国和中国对这场爆炸的承接方式,走出了两条完全不同的路线,而分叉点,来自 Anthropic 和谷歌做出的一个决定。

当 OpenClaw 在全球快速扩散之后,Anthropic 很快意识到一个严重的商业模型问题:一个每月付 49 美元 Claude Max 订阅费的用户,如果用 OpenClaw 跑一个 7 × 24 小时的自主 Agent 实例,他消耗的算力,可能相当于几百个普通对话用户一个月的总量。

订阅制定价,根本无法在 Agent 时代维持盈利。于是 Anthropic 宣布:通过个人订阅账号的 OAuth 令牌接入第三方工具,属于违规行为,发现即封号,无缓冲期。谷歌的态度与之类似,内部甚至直接屏蔽了员工访问 OpenClaw。

这个决定从商业逻辑上完全合理,但它产生了一个 Anthropic 自己可能没有充分预料到的连锁反应:它把数以百万计正在寻找稳定、低成本 Agent 后端的开发者,直接推向了中国模型。

从那一刻起," 用国产模型还是用 Claude 跑 OpenClaw" 就不再是一个纯粹的技术选择,而变成了一个风险管理决策。Anthropic 随时可能封号,ChatGPT 的 API 在高频调用下成本高昂,而 MiniMax M2.5、DeepSeek V3.2、Qwen 等国产模型不仅通过官方 API 明确支持 Agent 高频调用,价格更是只有 Claude Sonnet 的十分之一到二十分之一。

在 OpenRouter 这个全球开发者聚合平台上,这个选择被几百万次地做出,最终呈现为那个历史性的榜单:前五名调用量最高的模型,中国占了四席。

这种逆转不是因为中国模型突然变得比 Claude 更强,而是因为 Agent 时代的竞争维度变了。

在对话式 AI 时代,模型的质量上限决定一切;在 Agent 时代,成本、稳定性、对高频调用的支持程度,跑到了质量前面。这个竞争维度的切换,恰好是中国 AI 的优势区间。

明略科技副总裁李梦林将这件事的实质说得很准确:"OpenClaw 的 ' 自带代理 ' 模式,本质上触发了 AI 产业链的一次利益再分配。" 分配的结果,是一部分原本流向海外大厂的 API 收入,在 2026 年第一季度发生了历史上第一次大规模的逆转性迁移。

三、Token 战争的底层逻辑:谁是 AI 时代的水电煤

阿里在 2026 年 3 月做出的那个组织架构调整,现在回头看,是整个 Agent 时代最清醒的战略动作之一。

成立 Alibaba Token Hub(ATH)事业群,与电商、云智能并列,由 CEO 吴泳铭直接带队,整个事业群围绕一件事运转:创造 Token、输送 Token、应用 Token

这句话说起来像绕口令,但背后是一个极为清晰的产业判断:Token 正在成为 AI 时代的基础能源,就像电力之于工业时代,就像带宽之于互联网时代。

在这个判断下,大模型不再是终点,而是产能设施;云服务不再是存储和计算的租赁,而是 Token 的输配网络;应用产品不再是对话框,而是 Token 的消费终端。整条产业链的价值,最终收敛到一个核心指标:单位 Token 的成本和质量

这正是中国 AI 在过去两年一直在做却被严重低估的事情。DeepSeek 用 557 万美元训练出 GPT-4 级别的模型,不是技术炫耀,是在给 Token 工厂降低原料成本;

MiniMax M2.5 把 Agent 工具调用能力压缩到 10B 激活参数高效推理,定价 " 每小时 1 美元 ",是在以几乎是成本价的方式抢占基础设施层的市场份额;

Qwen 系列则在多模态与工具调用的兼容性上持续打磨,确保在 OpenClaw 生态里能成为开发者的默认选项之一。

三条路线指向的是同一个目标:在 Agent 时代的 Token 消耗链条里,占据成本最低、供应最稳的那个位置。

这条逻辑链,在 OpenClaw 爆发之前,是一个被少数人相信但很难被大众感知的故事。OpenClaw 的到来,把这个故事从 " 产业洞察 " 变成了 " 当下现实 ",因为 OpenClaw 是一台真实的、高功率运转的 Token 消费机器,它第一次让无数普通用户亲身感受到了 "AI 持续运转 " 和 "Token 持续消耗 " 之间的直接关系。谁能以最低的成本稳定地供给 Token,谁就成为这台机器的首选燃料。

国内另一个不太被注意到的数据,同样印证了这个判断。MiniMax M2.5 发布后 12 小时内登顶 OpenRouter 热度榜,一周内周调用量暴涨至 3.07 万亿 Token,超过 DeepSeek V3.2、GLM-5 等三家模型的总和。这个数字背后的驱动力,几乎全部来自 OpenClaw 生态的高频调用需求。

这意味着什么?意味着中国 AI 的商业化主战场,已经从 " 有多少人打开了这个 App",跳转到了 " 有多少 Token 在这套基础设施上流动 "。两个指标描述的是完全不同的商业逻辑:前者依赖的是用户粘性和消费习惯,后者依赖的是基础设施的规模效应和成本护城河。后者,才是真正难以被颠覆的竞争优势。

四、大厂战的真相:他们不是在卖龙虾,是在卖铲子

腾讯、阿里、字节、百度在 OpenClaw 热潮里的集体涌入,表面上看起来像是一场跟风,但仔细解剖每一家的动作逻辑,会发现背后藏着一个比 " 跟风 " 深得多的战略。

腾讯在深圳总部举办线下安装会,帮数百名用户把 OpenClaw 部署到 TencentCloud 上。腾讯官方文档写得清楚:"OpenClaw 来自开源社区,云应用不收费。" 然后补了一句:" 云服务器和 API 按实际消耗计费。" 这个商业模式,翻译过来就是:用 OpenClaw 的入口流量,喂饱腾讯云的算力和带宽业务。OpenClaw 本身是免费的诱饵,基础设施才是腾讯真正要卖的东西。

阿里的逻辑更赤裸。用户在轻量应用服务器上部署 OpenClaw 后,系统默认配置的是 DeepSeek API,但会自动引导用户前往 " 阿里云百炼大模型控制台 " 创建 API Key,通义千问系列模型的调用费用,从那个 API Key 里出。用户以为自己在用开源工具,但每一次 Agent 的工具调用,都在给阿里云的计量系统加一个计数。

百度直接上线了 " 移动版 OpenClaw",主打无需本地部署、云端环境隔离更安全,本质上是把 OpenClaw 做成了接入百度云算力的消费入口。字节跳动的 ArkClaw 连本地部署的麻烦都省掉了,做成了纯浏览器端产品,换取的是 ByteDance 火山引擎在每一次 Agent 运行背后的调用份额。

这场竞争里有一句话流传很广,出自 36kr 的一篇分析:" 这就是个卖铲子的生意。OpenClaw 淘金热里,中国大厂要做的,是成为那个向所有淘金者卖铲子的人。" 这个比喻非常准确,但它隐藏了一层更重要的东西:淘金热结束之后,铲子生意不会结束,但淘金者会换地方。真正的护城河,不是谁家的铲子卖得更多,而是谁把自己的算力基础设施做成了淘金者离不开的 " 水和电 "。

这也是为什么阿里成立 ATH 事业群的战略意义远超字面,它意味着阿里不满足于做 OpenClaw 时代的云服务供应商,而是要在下一个技术范式到来之前,把 Token 的生产、分发和消费整个链条攥在自己手里。

一家公司用事业群的层级来定义 "Token",意味着它相信 Token 会像流量一样,成为这个时代最核心的生产要素。如果这个判断是对的,先建起 Token 基础设施的那家公司,将获得比当年阿里云相对 AWS 更大的先发优势——因为这一次,它连模型都自己造。

五、中国独有的产业化速度,从哪里来

同样是 OpenClaw 热潮,美国的反应和中国的反应有一个结构性的差异,这个差异本身是一个非常值得深思的现象。

在美国,OpenClaw 的爆发主要停留在开发者社区层面,GitHub stars 狂飙、Discord 社群活跃、YCombinator 创始人陈嘉兴和 a16z 的多位合伙人公开宣称自己是狂热粉丝,但大规模的商业化产品、地方政府的扶持政策、数以千计的线下安装服务,并没有以同样的密度和速度出现。

在中国,这些东西几乎是同步爆发的。腾讯的线下活动、深圳无锡的政策补贴、JD.com 的 399 元安装服务、工程师收费 500 元上门部署……这是一个只有在中国市场才会呈现的景观:一项技术产品从开源框架到大众消费产品,从 GitHub 到线下安装摊位,中间的转化时间是以周而非月来计算的。

这种速度背后有几层结构性原因,每一层都比表面看起来更深。

第一层是超级 App 生态的天然适配。OpenClaw 需要接管消息应用来执行任务,而微信、飞书、企业微信恰好是中国职场人几乎所有工作流程的中枢。一个能直接操作微信、读取企业微信消息、在飞书上自动完成审批流的 Agent,在中国语境下的实用价值,远超一个操作 WhatsApp 或 Slack 的西方版本。这不是偶然的功能对齐,而是中国数字化基础设施的高度集中,意外地成了 Agent 落地的最佳土壤。

第二层是极端强烈的降本增效需求。中国经济在过去两年经历的压力,让企业和个人对 " 用更少的人做更多的事 " 有着美国市场难以比拟的迫切性。当一个老板发现可以用 Agent 替代部分外包需求,当一个自媒体人发现可以用 Agent 完成原本需要团队协作的工作流,他们不需要被教育 AI 的价值,他们只需要知道怎么用。这种需求密度,是 OpenClaw 在中国形成 " 安装排队 " 奇观的真实土壤。

第三层,也是最常被低估的一层:中国 AI 产业三年大模型竞争,意外地培养了一批真正懂得如何把 AI 工具变成商业产品的人。那些在 " 百模大战 " 里存活下来的团队,不是靠模型参数赢的,而是靠对中国用户需求的精准理解、对产品落地的执行速度、以及对商业化路径的持续摸索赢的。当 Agent 时代的机会窗口打开,这批人带着已经被磨砺过的产品直觉和执行能力,立刻知道往哪个方向冲。

六、弯道超车的真实边界

但这场胜利,有它真实的边界,而且这个边界比很多人愿意承认的更清晰。

中国赢的这一局,是应用层的商业化速度,不是基础技术的代际领先。

OpenClaw 框架本身是奥地利人写的。底层的大语言模型能力,在复杂推理上的天花板,全球学术界公认仍然是 Claude Opus 和 GPT-5.4 系列更高。中国模型胜出的核心变量是成本和对高频调用的支持,而不是在智能密度上真正超越了对手。在那些需要极高推理能力的任务上,复杂代码重构、高难度科学推断、需要深度上下文理解的多轮决策,绝大多数中国模型仍然建议开发者在关键步骤切换到旗舰海外模型。

这个差距不是永久性的,但它现在是真实存在的。

Agent 生态层面也存在类似的问题。中国迄今为止爆发的这波 Agent 热,在应用场景上高度集中在流程相对标准化的任务:数据整理、内容生产、邮件处理、简单的研究搜集。一旦进入需要真正判断力的非标任务——需要在模糊的信息中做权衡、需要在利益冲突的情况下做选择、需要理解复杂的组织政治——现阶段的 Agent 准确率会急剧下降,而这个下降是中美模型都面临的共同问题,不是专属于中国的短板。

安全隐患则是另一个更紧迫的现实问题。工信部的警告不是在扫兴,而是在指向一个系统性漏洞:当 Agent 拥有了真正的执行能力,它的权限边界就变得极其关键。Cisco 安全团队在测试中发现的那个第三方 OpenClaw 插件,在用户不知情的情况下执行了数据外泄,这不是极端案例,而是权限设计不完善的必然结果。

中国市场 " 先装了再说 " 的速度,在商业化上是优势,在安全治理上则是欠账。这笔账,要么在后续的产品迭代里系统性补上,要么等待一次大规模安全事件来倒逼。

有专家认为:中国企业真正的机会不是做更好的 OpenClaw,而是做 OpenClaw 做不到的事,更懂行业、更深场景、更稳落地。 这句话的潜台词是:OpenClaw 代表的是一种通用 Agent 框架的范式,但通用,意味着它在每一个具体的垂直场景里都没有真正的深度。深度,才是护城河。谁先在金融、医疗、制造、法律等高壁垒场景里建立起可信赖的专用 Agent 系统,谁才能真正把这次的速度优势转化为持久的商业壁垒。

七、这场竞争的真正胜负手,不在技术

如果说大模型时代的竞争是一场军备竞赛,谁的参数更大、谁的 benchmark 更高、谁的训练成本更低。那 Agent 时代的竞争,更像是一场基础设施战争:谁先把 AI 算力变成像水和电一样的公共服务,谁先把 Agent 能力嵌入每一个真实的工作流程,谁先构建起足够规模的可信数据和行业知识壁垒,谁就赢得了这场战争的入场券。

在这个框架下,中国目前领先的那一局,价值是真实的,但它是入场券,不是终局。

OpenClaw 带来的窗口期,核心价值在于它给了中国 AI 产业一个 " 先跑起来 " 的机会,在用户规模、在商业模式验证、在 Token 基础设施的体量上积累起真实的先发优势。

这个验证完成之后,资本和人才会更快速地向 Agent 赛道聚集,而中国 AI 产业在过去三年积累的执行速度和产品打磨能力,会在一个有确定性的赛道里得到最大化的发挥。

但窗口期不会无限延续。OpenAI 没有坐以待毙。GPT-5.4 在 3 月发布时就明确指向了 Agentic 工作流的原生支持,Codex 在企业端的渗透速度告诉市场,OpenAI 没有放弃 Agent 层的控制权。Google Workspace 的 Agent 化整合,有着任何独立产品都难以复制的分发网络优势。微软 Copilot 深度嵌入 Office 生态,面向的是中国大厂触达不到的数亿企业用户。

这场竞争的真实胜负,最终会在三年后的某个时间节点变得清晰——那时候,谁在真正高价值的垂直场景里建立起了不可替代的 Agent 基础设施,谁就赢了这场从大模型到 Agent 的换道赛。技术差距会缩小,成本优势会被追平,但那时候已经建立起来的用户信任、数据护城河和行业深度,才是真正的壁垒。

2025 年还是 " 千模混战 ",2026 年主战场已全面转向智能体。这个判断现在已经是共识,但共识从来不是终点,而是下一轮竞争的起跑线。

中国 AI 目前站在这条线的前面,但不是很多。

数据来源:

第一财经、《每日经济新闻》、CNBC、Fortune、36kr、国家数据局、华泰柏瑞基金、OpenRouter 公开数据、明略科技、CEIBS 中欧国际工商学院 | 数据截至 2026 年 4 月

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容