过去一年,外界对阿里云乃至阿里巴巴的讨论,大多集中在一件事上,它以史无前例的资本投入,重注 AI 基础设施。
外界甚至有些不解,做一个面向 AI 时代的云底座,需要花费这么多钱么,阿里巴巴是不是过于激进,想靠 AI 的资本叙事推升股价?
这些问题本身没有错,但它隐含了一个前提,还是用老框架评估阿里云,看市场份额、看增速、看跟 AWS 和 Azure 的差距。
5 月 20 日的阿里云峰会,阿里云给出的答案,不在这个框架里。

无独有偶,同期谷歌的 I/O 大会核心主题也是 Agent,谷歌把智能体全面塞进所有核心入口,从搜索框到 Chrome 浏览器,从 Android 手机到智能眼镜,Gemini 不再只是一个对话助手,变成一个可以持续运行、跨应用执行任务的 AI 代理。AWS,微软 Azure 都同样基于 Agent 的逻辑,重塑自己的业务和基础设施底座。
全球头部云厂商,他们自身也是大模型头部厂商,达成了一种默契,旧的云撑不住未来的 Agent,基础设施需要为 Agent 重建。就以往而言,大多数厂商的路线是,在现有架构上叠加一个 Agent 层,底层基础设施改动有限。
现在,阿里云真正意义上将云、芯片、模型做成一体化的组合。
当云的客户从人变成 Agent
理解阿里云这次重构的关键,在于一个判断,Agent 的负载特征,和传统云计算的负载特征,是两种完全不同的逻辑。
传统云计算的典型负载是稳态的,一个企业买一台 ECS,跑一个网站或者一个数据库,流量相对可预测,资源长期占用,云厂商的商业模式也因此围绕资源出租来设计,计算、存储和网络,是云计算生意的三大件。
但 Agent 的工作模式完全不同,一个 Agent 在执行任务时,可能在毫秒间连续发起数十次模型调用,执行完任务立即销毁环境,下一次被唤醒可能是几分钟后,也可能是几秒后,它的负载特性无规律且突发,在短生命周期内瞬时起量,用完即走。
表面上 Agent 调用的是模型,实际上是一整套 AI 全栈体系,它还需要沙箱环境来运行代码,需要数据库存储中间状态,需要网络访问外部工具,一个 Agent 的一次任务执行,牵动计算、存储、网络、模型推理等多种资源的协同调度。
新旧时代的云计算,复杂度完全是两个量级的问题。刘伟光提到,今年春节后,龙虾类智能体产品上线后,阿里云发现了一个有趣的现象,过去企业开通云资源需要人登录控制台手动操作,当下 Agent 直接在后台自动激活了云计算资源。
"Agent 能够以分钟为单位完成的云计算资源服务开通,可能是过去我们人以天为单位完成的工作。" 刘伟光说。这由不得云厂商不注意,Agent 已经在成为云计算的新界面,阿里云由此做出的判断是,未来云计算产品的主要使用对象,将逐渐从人类工程师变成 Agent。
这个判断,也贯穿阿里云的整个重构逻辑,为了让 Agent 真正用得上云,阿里云对云产品进行了三个维度的改造,Skill 化、MCP 化和 CLI 化。
简单来说,就是把每一个云产品都变成 Agent 可以像调函数一样调用的标准化能力模块,传统云产品的控制台对人友好,但对 Agent 毫无意义,Agent 需要的是结构化的能力描述,以及明确的调用协议。

数年之前云厂商做 AI,主要是把算力资源卖给模型公司去训练和推理,如今阿里云要做的,是让云本身成为 Agent 运行的操作系统。
阿里云补上所有拼图
如果说,Agentic Cloud 是阿里云在架构层面的回答,那芯片就是这个回答的物理基础。

据介绍,平头哥未来两年将陆续推出算力更强的真武 V900、真武 J900 两代芯片,这大概率意味着,阿里云的芯片迭代节奏,与模型迭代节奏对齐,每一代芯片性能的提升,直接转化为大模型训练和推理能力的跃升。

刘伟光也反复强调了芯片-云-模型-推理一体化的逻辑," 今天给客户最终呈现的结果,是齿轮咬合的组合效应,是模型能力、芯片能力和云能力三件事的完整有机结合。"
在芯片和模型之间,百炼推理平台起到 " 生产车间 " 的作用,阿里云在百炼上构建了大规模 GPU 资源集群,并通过一套针对 Agent 场景的技术栈来应对推理侧的特殊挑战,并池调度将 GPU 资源统一管理,提升整体利用率;上下文缓存消除 Agent 在多轮对话和长链路任务中的重复计算开销;吞吐弹性调度应对 Agent 并发请求的波峰波谷,确保流量激增时不崩溃、低谷期不浪费。
更值得注意的是 Agentic RL 机制,基于 Agent 实际执行反馈的强化学习,让模型在真实场景中越用越好,形成持续迭代的闭环。此外,百炼内建了安全治理能力,这一点在 Agent 自主运行的语境下极其关键,一个 24 小时不间断执行任务的 Agent,如果没有边界约束,后果不可控,百炼的安全机制确保 Agent 始终在预设的权限范围内行动。
类比谷歌,谷歌的 TPU 和 Gemini 模型的深度绑定,在其自有的深度学习框架里跑出了最高的性价比,不论是技术还是资本市场,都已经高度认可这条路线。阿里用自研芯片跑自研模型,通过软硬件的深度协同,也可以把每一张芯片的每一个算力单元都榨到极致。
再看模型部分,最新发布的 Qwen3.7-Max 在三方机构 Arena 全球大模型盲测总榜中,Qwen3.7-Max 位列国产模型第一,与 GPT、Claude、Gemini 的最强模型接近。

更有说服力的是一个实战案例,在从未接触过的真武 M890 芯片上,Qwen3.7-Max 仅凭一份任务说明,从零开始自主工作 35 小时,独立完成了一个生产级 AI 计算内核的编写与调优,最终性能较官方版本提升 10 倍。
没有人类干预,没有中间指导,35 小时,从零到生产级,这充分体现出模型 " 自主完成复杂工程任务 " 的能力,它运行的硬件底座,恰恰是阿里自研的芯片,芯片和模型的协同进化,在这个案例里被具象化了。
值得一提的是,近 3 个月内千问旗舰模型已经连续迭代了 3.5、3.6、3.7 三个版本。这种发布节奏本身就说明,阿里巴巴在刻意加速模型进化,以匹配 Agent 时代对模型能力的指数级增长需求。

卖 Token,就是未来阿里云最大的生意
技术架构的重构,最终要回到商业逻辑上来理解。阿里巴巴上周的财报披露了一个关键数据,AI 模型及应用服务的 ARR 已超过 80 亿元,预计年底突破 300 亿元。消息发布当天,阿里股价飙涨 8%。
阿里云内部的判断更为激进,Agent 驱动的 MaaS 收入将取代 ECS,成为阿里云最大的产品线。阿里云的商业模式彻底变化,增长引擎正在从以虚拟机为计量单位的资源收入,全面切换为以 Token 为计量单位的 AI 收入。
百炼平台也遵循开放生态策略,不只跑阿里自研的千问模型系列,还同步接入了智谱 GLM-5.1、MiniMax M2.7、月之暗面 Kimi K2.6、Vidu 等第三方模型。
企业客户在真实业务中会使用多模型组合,百炼要做的是让客户在一个平台上找到每个领域最好的模型组合和最具性价比的推理服务,只要模型部署在阿里云上,不管是自研还是第三方,产生的都是 Token 收入。
刘伟光估计,对于 AI 原生的创业企业来说,MaaS 开销几乎就是 100% 的 IT 支出;在中国互联网企业中,Token 相关的支出已经占到 IT 总支出的 15% — 20%;传统企业目前还在 5% 以下,但增长曲线陡峭。阿里云内部的指标是,每一个企业客户在阿里云上的 Token 支出,应该不低于该客户总花费预算的 20%。
更具体的变化体现在行业侧,卖 token 实际上拓展了阿里云的业务边界。以汽车行业为例,阿里云以往能做的就是帮车企把 ERP 等系统上云,后来延伸到智驾的算力和云底座,再后来是座舱大模型对话。
当前,客户营销、广告生成这些曾经完全不在云厂商业务范围内的事情,都因为 AI 能力的溢出而变成了新的收入来源,阿里云内部甚至都没有预料到,能拿到客户的这部分业务的预算。
还有一个原来云厂商完全吃不到的市场,企业内部的软件开发和人力外包,这部分预算长期由系统集成商和外包公司拿走,云厂商无从插手。但 AI Coding 的出现,让这部分预算变成了 Token 支出。
诸如此类的变化汇总起来,意味着云计算行业的天花板被大幅抬高了。以往云厂商的收入上限,取决于企业 IT 预算中可以迁移上云的部分,数据库、中间件、大数据平台,存量市场迁移为主,也创造出一些新的云原生需求。
AI 把企业内部的运营管理、市场营销、软件开发这些原本不属于 "IT 基础设施 " 的支出,都拉进了云厂商的收入池。
One more thing
阿里云成立 17 年来,第一次发布了另一个官网,千问云官网,本质上是对新商业逻辑的反馈动作。

当云的主要消费者不再是人,而是 Agent,所有围绕人类设计的界面、流程和交互逻辑,都需要被重写。
上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期,所有人把 PC 官网的流量让位给 App 的阶段。只不过这一次更彻底,App 至少还需要人去打开,Agent 只需要读一条指令。
回到开头的问题,阿里巴巴做云的决心,到底应该被怎样评估?
从资本投入看,万亿级的 AI 基础设施投资确实史无前例。但只看投资额,会错过更本质的变化,阿里云从芯片、云架构、模型、推理平台到产品入口,做了一次彻底的全栈重构。
这背后的赌注,就是当 Agent 成为云的主要消费来源时,谁先完成基础设施的重建,谁能实现更好的效果以及更高的性价比,谁就拿到下一个十年的入场券。全球头部的云厂商,无论是谷歌、AWS、微软还是阿里云,都做出了同一个选择。
这不是一家公司的冒险,而是一个行业的共识,现在阿里云想做的,就是冲在最前。(作者|张帅,编辑|盖虹达)