告别价格战，大模型共迎通胀时代

文 | 锌刻度，作者 | 陈邓新，编辑 | 李季

眼下，涨价成为大模型的关键词。

迈入 2026 年，大模型不再是优惠缩水，而是毫不掩饰地开启了涨价模式，大大小小的厂商纷纷入局，智普甚至在短短三个月之内两次提价。

以至于，国产大模型定价首次与海外头部厂商对齐。

大模型涨价，是昙花一现还是旷日持久？降价争夺市场的打法，是否走到了尽头？价值战会成为未来竞争的核心叙事吗？

不愿贱卖成为行业的共识

曾几何时，降价才是大模型的竞争基调。

" 全线降价 "" 两款产品免费 "" 百万 Token 一分钱 "" 比行业同类产品便宜 90%"" 免费、全面免费、永久免费 " ……

这一系列动作的背后，则是大模型为了长远发展选择牺牲短期利益。

通俗易懂地说，为了 AI 普惠需要不断降低大模型的 Token 价格，唯有此才可以在 B 端赋能千行百业、在 C 端成为标配的日常工具。

Token 成为大模型的重中之重

毕竟，将市场蛋糕越做越大才可以吃到规模化的红利，从而获得更大的势能。

阿里云资深专家朱迅垚曾表示：" 阿里云大模型降价，是希望让更多的使用者和中小企业用上大模型，加速 AI 应用市场的提前爆发。"

百度智能云 AI 与大模型平台总经理忻舟亦表示：" 大模型仍处于市场培育阶段，企业只有在认识到大模型带来的巨大价值后，才能将其应用于更大规模、更复杂的业务场景中。"

需要注意的是，大模型并非一味追求降价，也通过创新进行让利。

以 2025 年 6 月发布的豆包大模型 1.6 为例，一改行业之前的定价惯例：深度思考或多模态能力无需为 Token 额外买单，且 Token 的价格随着 0 — 32K、32K — 128K 和 128K — 256K 这三个输入长度的增长而增加，进行了分区定价，性价比更高。

分区定价打破常规

不曾想，大模型价格只降不升的传统被打破了。

迈入 2026 年之后，GLM、Seedance、HY2.0 Instruct 等大模型或多或少有了提价的动作，特别是 GLM-5.1 在 Coding 场景的缓存命中 Token 价格接近 Anthropic 旗下大模型 Claude Sonnet，这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。

这意味着，大模型越来越不愿意贱卖 Token 了。

MiMo 大模型负责人罗福莉表示：" 我建议 LLM 公司在弄清楚如何在不造成资金流失的情况下为 Coding 方案定价之前，不要盲目地竞相压低价格。以极低的价格出售 Token，同时对第三方敞开大门，这看起来对用户很有吸引力，但这却是一个陷阱—— Anthropic 刚刚摆脱的那个陷阱。"

简而言之，打价格战不如打价值战。

Token 价格低，不意味着模型能力强，如若模型能力不足则会消耗更多的 Token，进而导致更大的浪费，最终用户与大模型双输。

如此一来，大模型回归价值博弈成为一道必答题。

竞争焦点出现了转向

大模型从价格战走向价值战，背后的缘由有三。

首先，供不应求。

智能体时代，Token 的长度从十万级向百万级、千万级跃迁，与此同时消耗量也实现了上百倍增长，成为大模型提高获客量的关键抓手。

之所以如此，与思考链路延长息息相关。

一问一答模式的 Token 消耗是线性增长，而智能体模式可以进行长链路思考、执行多重任务、完成循环调用等，Token 消耗是指数级增长。

关于此，从智谱的数据就可见一斑。

2026 年第一季度，智谱大模型的 API 调用定价提升了 83%，而 Token 消耗量增长了 400%，提高定价并未抑制需求，反而出现了供不应求的现象。

智谱 CEO 张鹏表示："AGI 时代的商业价值可以归结为一个简洁的公式：智能上界 × Token 消耗规模，智能上界决定了定价权，Token 消耗规模决定了价值体量。未来，衡量一个个体或组织价值的标准，不再是掌握了多少信息，而是其作为 Token 架构师，在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。"

正因为如此，大模型的竞争焦点出现了转向。

大模型不再围绕参数、数量、打榜等指标比拼，而是转向拼应用、拼生态，因而性价比不再是唯一的关键指标，价值创造站到了 C 位。

譬如，混元 3D 世界模型 2.0 可以理解文字、图片、视频等不同类型的输入，自动生成 3D 场景，无缝对接游戏开发、AI 漫剧等工作流。

一句话生成 3D 世界

再譬如，GLM-5.1 能够在一次任务中独立、持续工作超过 8 小时，成为当下唯一具备此能力的开源模型。

其次，分担成本。

大模型落地离不开云计算的鼎力相助，但云计算的成本肉眼可见的在不断增长，如此涨价成为必然。

以数据中心为例，一方面存储芯片等成为卖方市场，持续抬高新建成本；另外一方面由于是耗电大户，在能源价格高企的背景之下，运营成本被迫不断抬升。

不难看出，大模型服务比传统的互联网服务成本更贵。

更为关键的是，由于 AI 技术不断迭代，大模型也需要推陈出新，进一步推高了开支，亟须探索良性的、合理的商业化路径。

火山引总裁谭待曾有言：" 对于企业级市场来说，商业模式是建立在可持续发展的基础上，任何商品必须是盈利的，不能靠补贴来降价。如果降价是亏损的，规模越大亏得越多，这就不是合理的商业模式。"

再次，胜者为王。

随着 " 百模大战 " 的演进，不少实力欠佳的玩家选择退场，即便是实力强劲的玩家也难以面面俱到，选择聚焦主航道。

Sora，就是最好的明证。

作为 OpenAI 旗下的 AI 视频生成工具，Sora 诞生之初备受好评，视为 AI 生成视频赛道的颠覆性产品。

却不想，由于入不敷出，成为 OpenAI 的弃子。

Sora 寿终正寝

公开数据显示，Sora 商用级内容的生成命中率仅 5%～10%，生成一分钟高质量视频的推理成本为 30~50 美元，因而 30 天用户留存率为 1%，60 天留存率为 0%。

简而言之，Sora 并没有成为生产力工具。

其实，Sora 不行，不意味着 AI 生成视频不行，Seedance、可灵等中国 AI 生成视频大模型不但技术过硬，更是不缺应用场景，最终上演了弯道超车。

" 蓝鲸科技 " 报道："Seedance 2.0 出来前，大多数模型每次只能生成一个 5 秒的视频，5 秒里可能 3 秒都是废片，一个完整的镜头需要几个视频拼接，而 Seedance 2.0 能够生成完整的 15 秒视频，运镜切换自如。"

Seedance 之外，可灵的表现也可圈可点。

财报数据显示，2025 年第一季度至第四季度，可灵的营业收入分别为 1.5 亿元、2.5 亿元、3 亿元、3.4 亿元，虽然增速有所放缓，但整体依然处于增长的势态。

总而言之，大模型走过了采取低价甚至免费策略进行 AI 普惠的阶段，迈入了价值创造的阶段，为了更好地释放生产力，既要比拼模型的高效，也要比拼场景的适配。

那么，大模型竞速进入 " 深水区 "。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

告别价格战，大模型共迎通胀时代

宙世代

一起剪

相关阅读

标榜独占主机 微软却放手厂商魔改：华硕、微星将入局Xbox定制

告别价格战，大模型共迎通胀时代

驭势科技冲刺港股IPO，自动驾驶封闭场景第一股呼之欲出

身价超15000亿却很会省！扎克伯格绝不会把钱浪费在5件事上

国产AI有多赚钱：MiniMax可在8路N卡上1分钟赚1美元 成本不到0.3美元

RAG准确率90%？先过文档解析这关

陈昌凤：AI短剧版权治理需跳出传统，构建新型适配治理体系

培训岗的遮羞布，被AI掀了

Kimi K2.6 这次把 Agent 玩明白了吗？

“我身体健康”，库克现身员工大会透露卸任原因；候任CEO：苹果将再次改变世界，本质不会改变！苹果市值跌破4万亿美元

微软发布紧急更新！修复9.1分高危漏洞

SpaceX猎鹰火箭600次回收完成！星链卫星在轨10279颗

萤石Y31系列全景AI智能锁发布：支持AI人脸识别、VR预览

AI剧/漫剧月报：播放量天花板破6亿，99.28%的新剧播放增量不足3千万

大疆Pocket 4守城有余，惊艳不足

最新评论

钛媒体

热门推荐

企业资讯

标榜独占主机微软却放手厂商魔改：华硕、微星将入局Xbox定制

国产AI有多赚钱：MiniMax可在8路N卡上1分钟赚1美元成本不到0.3美元