关于ZAKER Skills 合作
全天候科技 4小时前

从 Anthropic 收入爆增到 OpenAI 长期锁算力,AI 需求“垂直爆发式”增长,供应瓶颈无处不在

AI 行业正在经历一场史无前例的需求爆炸。

5 月 25 日,据追风交易台消息,花旗(Citi)在最新发布的《推理前瞻》系列研究报告中,用一个词精准描述了当前态势—— "需求的垂直之墙"(Vertical Wall of Demand),这一说法最初由 OpenAI 首席财务官 Sarah Friar 提出,如今已被一系列硬核数据所印证。

报告揭示了一组令人瞠目的数据:Anthropic 预计 2026 年第二季度收入将达到109 亿美元(环比暴增 130%),而 OpenAI 仅在 2026 年第一季度就实现了57 亿美元的收入。然而,真正的市场博弈在于:

这种垂直爆发的需求,正迎头撞上增长缓慢的 " 倾斜式 " 供应曲线。算力成本和推理成本正在显著上升,OpenAI 等头部企业开始通过 1-3 年的长期合同锁定客户算力,而顶尖人才的短缺更是加剧了供应链的紧张。

报告的核心结论非常明确——AI 基础设施和稀缺的推理能力已成为绝对的卖方市场,科技巨头正通过激烈的定价分层来榨取利润,而谁能最终捕获 AI 的 " 生产力红利 "(是传统软件供应商、AI 平台、客户还是劳动力),将是下一阶段资本市场定价的核心主线。

需求端信号:企业级 AI 采用率呈 " 垂直墙 " 式爆发

各项使用量、算力承诺和企业人员调整数据均表明,AI 需求仍在加速,且处于早期阶段。

收入与使用量呈现指数级增长:

Anthropic 预计 2026 年第二季度收入将从一季度的 48 亿美元飙升至 109 亿美元,环比增长 130%;预计到 2026 年二季度末,其年度经常性收入(ARR)将达到约 500 亿美元,远高于 3 月份的 300 亿美元。

OpenAI 同样表现惊人,仅 2026 年一季度就报告了 57 亿美元的收入,而 2025 年上半年的总收入仅为约 43 亿美元。

此外,谷歌目前每月的 Token 处理量高达3.2Q(千万亿),同比激增 7 倍

劳动力市场的边际信号: Intuit、Meta 和 Cisco 近期的裁员行动,成为了 AI 采用率产生实际影响的潜在信号。

这进一步引发了市场关于谁将真正获得 AI" 生产力红利 " 的激烈辩论,尤其是在基础设施容量受限已经开始在边际上影响需求的情况下。

供给端约束:算力商业化与顶尖人才成为绝对瓶颈

面对垂直的需求,前沿 AI 实验室正被迫以类似云计算的机制来商业化其稀缺的资源。

长期算力锁定模式开启:OpenAI 推出了全新的 " 保证容量 " 模型,允许客户做出 1 到 3 年的算力承诺,以换取按年度承诺规模递增的 Token 折扣。

巨头结盟与人才争夺:Blackstone 与谷歌云的合作,以及 Anthropic 近期的推理交易,都反映出算力即服务(compute-as-a-service)和预留实例模式的必然趋势。

同时,Andrej Karpathy 加入 Anthropic 的事件提醒市场:在实现前沿 AI 能力方面,供应链最严重的瓶颈依然存在于顶尖劳动力层面。

推理经济学:定价分层加剧,前沿模型成本飙升

尽管基础访问层的竞争日益激烈,但前沿 AI 推理的成本毫无通缩迹象,供应商正通过订阅级别和高级推理的溢价来积极细分市场。

订阅模式的精细化收割:谷歌将其顶级的 AI Ultra 订阅价格从每月 250 美元降至 200 美元,并针对 " 生产型消费者(prosumers)" 推出了每月 100 美元的新层级(使用上限是 Pro 计划的 5 倍,并捆绑了 YouTube Premium)。这一举措显示出 Google 在扩大用户基础与维护高端定价之间的精细平衡。

前沿模型成本不降反升:GPT-5.5 的价格是 GPT-5.4 的两倍,同时 AI 实验室正在逐步淘汰旧模型。这表明供应商正在通过订阅层级和高级推理溢价,更激进地对市场进行细分

花旗的渠道调研显示,OpenRouter 针对 GPT-5.5 的成本分析显示,按工作负载细分,成本增加了 49% 至 92%,尽管这部分被完成 Token 数量减少 19% 至 34% 所抵消

渠道调研表明,这种成本上升已经在边际上对企业的 AI 采用产生了影响,意味着企业在享受更强大模型能力的同时,也面临更高的推理成本压力。

模型发布与监管前瞻:Blackwell 模型将至,监管框架酝酿中

在技术催化剂和政策监管方面,市场即将迎来新的变量。

技术催化剂: 继 Mythos 之后,首批基于 Blackwell 架构训练的模型即将在近期发布,这将成为竞争格局中的下一个重要技术催化剂。

当前前沿模型排行榜(基于 Artificial Analysis 智能指数)显示,OpenAI 的 GPT-5.5(xhigh)以 60 分位居榜首,混合定价为每百万 token 4.35 美元;Google 的 Gemini 3.1 Pro Preview 和 Anthropic 的 Claude Opus 4.7(max)并列第二,均为 57 分,但 Google 定价更具竞争力,仅为每百万 token 1.74 美元,而 Claude Opus 4.7 为4.10 美元

未来模型发布时间表方面,花旗预计 2026 年二季度将有多款重磅模型发布,包括 Gemini 3.5 Pro、Claude Sonnet 4.7、Jamba2 Large 等;三季度预计 GPT-6.0 和 Qwen 4 将亮相;四季度则有 Claude Opus 5 和 Sonnet 5、DeepSeek V5 等重量级产品。

监管框架的介入: 报告指出,美国政府正在准备一项自愿框架,要求前沿 AI 实验室在公开发布前 90 天向政府提供符合条件的前沿模型,这种发布前访问权还可能扩展到关键基础设施提供商。

虽然这与 Anthropic 处理其 Mythos 模型的方法类似,但原定签字仪式的推迟表明该框架可能还会迎来修订。

相关标签
全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容