文 | 锦缎
1945 年 2 月,美、英、苏三巨头在克里米亚半岛坐下来,划定了此后半个世纪的游戏规则。大国划定势力范围,小国接受安排,体系一旦确立,后来者很难翻盘。历史学家管这叫 " 雅尔塔体系 "。
2026 年 4 月的第三个周四,全球 AI 行业走到了类似的节点。
24 小时内发生的事,从 GPT-5.5 到 DeepSeek-V4,表面是几款模型的迭代。深层看,却是一场关于定价权与技术尊严的博弈。
两条路线在这一刻被泾渭分明地划定出来:一条是 OpenAI 的算力霸权加定价权收割,另一条是 DeepSeek 的算法极效加极致普惠。
这已经不能被简单称为技术竞赛的延续,而是全球人工智能产业秩序重建的起点。规则正在被写下,参与者只能选择站在哪一边。
01 硅谷的算盘
GPT-5.5 的真正分野,不在参数规模,在智能体化的底层跃迁。
OpenAI 公布了一项指标。内部测试 Expert-SWE 中,人类需要 20 小时的长周期工程任务,它实现了端到端的自主修复。它不再补全代码,而是拥有了 " 系统形状理解 " 能力。能理解庞大代码库中的依赖关系,预判一行改动会不会让另一个模块崩溃。配合多模态的计算机使用能力,跨软件穿梭、读屏、点击 UI、跑测试,独立完成调试闭环。AI 的角色,正从被动工具向主动同事迁移。
这种能力已渗透进 OpenAI 内部。财务团队用它处理 2.4 万份税务表格,7.1 万页,几个月的工作量压缩到两周。市场团队每人每周节省 5 到 10 小时。
学术界同样震动。GPT-5.5 在组合数学领域为百年难题 " 非对角拉姆齐常数 " 提出了渐进式证明,已通过 Lean 形式化验证的严格审查。它从检索已知,跨入了探索未知。
还有一件事更值得注意。为在英伟达 GB200/300 系统上提升推理效率,GPT-5.5 分析了数周的生产流量模式,自己编写了一套动态负载均衡与分区启发式算法。不牺牲智能水平,Token 生成速度提升 20% 以上。AI 开始参与自身基础设施的优化。这个闭环一旦形成,技术迭代的加速度会超出多数人的预期。
但这轮发布真正的冲击,是价格。
GPT-5.5 Pro 的 API 定价,输入 30 美元,输出 180 美元。单位是每百万 token。行业此前的天花板 Claude Opus 4.7,输出价是 25 美元。GPT-5.5 直接翻了 7 倍。
智能体任务的真实场景里,模型需要不断循环、调用工具、反复验证。一个轻量级任务消耗千万级 token 是常态。
这意味着,API 门槛已被暴力抬升。任务刚开始几步,几千甚至上万美元就进了 OpenAI 的账户。
但更值得追问的细节在这里。ChatGPT 的 Plus 和 Pro 订阅套餐,价格没动。没有涨价,没有停续,没有限流。20 美元一个月的 Plus 用户,仍然能用近乎不合理的价格,使用这款地表最强模型。
这是一场精心设计的商业架构调整。用 API 天价定义行业天花板,倒逼高用量用户转向订阅,把分散的 API 收入转化为稳定现金流。另一边,用大众能承受的订阅费守住用户基本盘。
它传递的市场法则是冷的。基础模型的成本与分配,由算力垄断者定义。
02 中国的出路
理解 DeepSeek V4 的价值,要回到一个残酷的起点。
由于出口管制,中国 AI 企业短期内无法在算力储备上与 OpenAI 的芯片矩阵匹敌。中国人对 " 卡脖子 " 的敏感,源自真实的困境。每一次技术封锁,最终都指向同一条出路:在硬件受限的维度上,向算法的纵深处掘进。
DeepSeek 的战略回应,是这套逻辑在 AI 时代的延续。
上下文长度是大模型的算力黑洞。传统注意力机制下,计算量随序列长度平方级爆炸。这正是智能体快速烧钱的技术根源。每次交互堆积上下文,Token 消耗在不知不觉中失控。
DeepSeek V4 拿出的方案是 CSA 加 HCA,混合压缩注意力机制。CSA 把每 m 个 token 的 KV 缓存压缩成一个条目,再通过稀疏注意力筛选 top-k 参与计算。HCA 压得更狠,全部压缩后执行稠密注意力。模型只在序列维度上关注最核心的特征,实现了高效的信息压缩。
数据回报相当可观。100 万 token 的超长上下文,1.6 万亿参数的 V4 Pro,单 token 推理计算量只有上一代的 27%,KV 缓存占用率暴跌到 10%。他们还废弃了传统的 AdamW 优化器,引入 Muon 优化器,独创了 mHC 流形约束超连接。残差映射被严格约束在双随机矩阵上,信号在数百层网络中传递,既不衰减也不爆炸。
算法取巧通常有代价。但 V4 Pro 的实战表现几乎打破了这个预设。Codeforces 全球天梯榜上,排名第 23 位,与 GPT-5.4 持平。开源模型历史上第一次在这个榜单上与闭源顶尖模型并驾齐驱。DeepSeek 内部员工已全面用它做智能体编程,体验超越 Claude Sonnet 4.5,接近 Opus 4.6。
后训练层面也有创新。抛弃了成本高昂的传统 RLHF 奖励模型,提出 OPD 同策略蒸馏。数学、编程等领域的专家模型,通过逆 KL 散度无损融合进 V4 Pro。知识迁移完成了算法代际升级。
真正刺痛行业的,是定价。
V4 Pro 输出价格:人民币 24 元每百万 token。同步发布的 V4 Flash,输出价只要 2 元。比前代更便宜,性能只是略逊于国内顶尖模型。在性价比维度上,这条护城河短期内很难被撼动。官方技术报告透露,下半年国产昇腾 950 超节点批量上市后,价格还会进一步下调。
如果你认为这仅仅是 " 促销让利 " 就过于天真了。本质上,这将是一次直冲产业定价体系的结构性狙击。
潜台词很清楚。基础模型服务的价值,不由算力的稀缺性来定义,该由算法的效率来决定。在硬件受限的市场,这条路必须走通。定价权的争夺,本质上就是市场准入权的争夺。
03 最后的启示
雅尔塔体系给历史的真正教训,不在于谁输谁赢,而在于规则一旦被写下,后来者的腾挪空间就被锁定了大半。
今天,OpenAI 用定价权划下了一条线。这条线以上,是它定义的 " 顶级生产力 ",按算力成本收租。这条线以下,是 DeepSeek 硬生生撕开的口子,用算法效率重新标定普惠的门槛。
未来几年的产业演进,大概率不会脱离这个框架。有人在高处制定标准,有人在低处重构规则。身处中间地带的玩家,如果既没有定价权,又不肯在底层效率上死磕,最终的出路只能是在后台调参数、降体验,用体面的方式做不体面的事。
那个周四真正回答的问题只有一个,当算力不再是你手里的牌,你还能不能上桌。DeepSeek 给出了一个答案,但这个答案是否能持续,取决于一个更深层的变量:当对手下一次抬升标准时,算法创新还能不能跟得上。
这才是雅尔塔时刻的冷峻之处。它远不是终局,它只是告诉每一个人:站队的时刻到了。
(本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。)