文 | 锌刻度,作者 | 陈邓新,编辑 | 李季
眼下,涨价成为大模型的关键词。
迈入 2026 年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。
以至于,国产大模型定价首次与海外头部厂商对齐。
大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?
不愿贱卖成为行业的共识
曾几何时,降价才是大模型的竞争基调。
" 全线降价 "" 两款产品免费 "" 百万 Token 一分钱 "" 比行业同类产品便宜 90%"" 免费、全面免费、永久免费 " ……
这一系列动作的背后,则是大模型为了长远发展选择牺牲短期利益。
通俗易懂地说,为了 AI 普惠需要不断降低大模型的 Token 价格,唯有此才可以在 B 端赋能千行百业、在 C 端成为标配的日常工具。

毕竟,将市场蛋糕越做越大才可以吃到规模化的红利,从而获得更大的势能。
阿里云资深专家朱迅垚曾表示:" 阿里云大模型降价,是希望让更多的使用者和中小企业用上大模型,加速 AI 应用市场的提前爆发。"
百度智能云 AI 与大模型平台总经理忻舟亦表示:" 大模型仍处于市场培育阶段,企业只有在认识到大模型带来的巨大价值后,才能将其应用于更大规模、更复杂的业务场景中。"
需要注意的是,大模型并非一味追求降价,也通过创新进行让利。
以 2025 年 6 月发布的豆包大模型 1.6 为例,一改行业之前的定价惯例:深度思考或多模态能力无需为 Token 额外买单,且 Token 的价格随着 0 — 32K、32K — 128K 和 128K — 256K 这三个输入长度的增长而增加,进行了分区定价,性价比更高。

不曾想,大模型价格只降不升的传统被打破了。
迈入 2026 年之后,GLM、Seedance、HY2.0 Instruct 等大模型或多或少有了提价的动作,特别是 GLM-5.1 在 Coding 场景的缓存命中 Token 价格接近 Anthropic 旗下大模型 Claude Sonnet,这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。
这意味着,大模型越来越不愿意贱卖 Token 了。
MiMo 大模型负责人罗福莉表示:" 我建议 LLM 公司在弄清楚如何在不造成资金流失的情况下为 Coding 方案定价之前,不要盲目地竞相压低价格。以极低的价格出售 Token,同时对第三方敞开大门,这看起来对用户很有吸引力,但这却是一个陷阱—— Anthropic 刚刚摆脱的那个陷阱。"
简而言之,打价格战不如打价值战。
Token 价格低,不意味着模型能力强,如若模型能力不足则会消耗更多的 Token,进而导致更大的浪费,最终用户与大模型双输。
如此一来,大模型回归价值博弈成为一道必答题。
竞争焦点出现了转向
大模型从价格战走向价值战,背后的缘由有三。
首先,供不应求。
智能体时代,Token 的长度从十万级向百万级、千万级跃迁,与此同时消耗量也实现了上百倍增长,成为大模型提高获客量的关键抓手。
之所以如此,与思考链路延长息息相关。
一问一答模式的 Token 消耗是线性增长,而智能体模式可以进行长链路思考、执行多重任务、完成循环调用等,Token 消耗是指数级增长。
关于此,从智谱的数据就可见一斑。
2026 年第一季度,智谱大模型的 API 调用定价提升了 83%,而 Token 消耗量增长了 400%,提高定价并未抑制需求,反而出现了供不应求的现象。
智谱 CEO 张鹏表示:"AGI 时代的商业价值可以归结为一个简洁的公式:智能上界 × Token 消耗规模,智能上界决定了定价权,Token 消耗规模决定了价值体量。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为 Token 架构师,在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。"
正因为如此,大模型的竞争焦点出现了转向。
大模型不再围绕参数、数量、打榜等指标比拼,而是转向拼应用、拼生态,因而性价比不再是唯一的关键指标,价值创造站到了 C 位。
譬如,混元 3D 世界模型 2.0 可以理解文字、图片、视频等不同类型的输入,自动生成 3D 场景,无缝对接游戏开发、AI 漫剧等工作流。

再譬如,GLM-5.1 能够在一次任务中独立、持续工作超过 8 小时,成为当下唯一具备此能力的开源模型。
其次,分担成本。
大模型落地离不开云计算的鼎力相助,但云计算的成本肉眼可见的在不断增长,如此涨价成为必然。
以数据中心为例,一方面存储芯片等成为卖方市场,持续抬高新建成本;另外一方面由于是耗电大户,在能源价格高企的背景之下,运营成本被迫不断抬升。
不难看出,大模型服务比传统的互联网服务成本更贵。
更为关键的是,由于 AI 技术不断迭代,大模型也需要推陈出新,进一步推高了开支,亟须探索良性的、合理的商业化路径。
火山引总裁谭待曾有言:" 对于企业级市场来说,商业模式是建立在可持续发展的基础上,任何商品必须是盈利的,不能靠补贴来降价。如果降价是亏损的,规模越大亏得越多,这就不是合理的商业模式。"
再次,胜者为王。
随着 " 百模大战 " 的演进,不少实力欠佳的玩家选择退场,即便是实力强劲的玩家也难以面面俱到,选择聚焦主航道。
Sora,就是最好的明证。
作为 OpenAI 旗下的 AI 视频生成工具,Sora 诞生之初备受好评,视为 AI 生成视频赛道的颠覆性产品。
却不想,由于入不敷出,成为 OpenAI 的弃子。

公开数据显示,Sora 商用级内容的生成命中率仅 5%~10%,生成一分钟高质量视频的推理成本为 30~50 美元,因而 30 天用户留存率为 1%,60 天留存率为 0%。
简而言之,Sora 并没有成为生产力工具。
其实,Sora 不行,不意味着 AI 生成视频不行,Seedance、可灵等中国 AI 生成视频大模型不但技术过硬,更是不缺应用场景,最终上演了弯道超车。
" 蓝鲸科技 " 报道:"Seedance 2.0 出来前,大多数模型每次只能生成一个 5 秒的视频,5 秒里可能 3 秒都是废片,一个完整的镜头需要几个视频拼接,而 Seedance 2.0 能够生成完整的 15 秒视频,运镜切换自如。"
Seedance 之外,可灵的表现也可圈可点。
财报数据显示,2025 年第一季度至第四季度,可灵的营业收入分别为 1.5 亿元、2.5 亿元、3 亿元、3.4 亿元,虽然增速有所放缓,但整体依然处于增长的势态。
总而言之,大模型走过了采取低价甚至免费策略进行 AI 普惠的阶段,迈入了价值创造的阶段,为了更好地释放生产力,既要比拼模型的高效,也要比拼场景的适配。
那么,大模型竞速进入 " 深水区 "。