关于ZAKER Skills 合作
全天候科技 10小时前

告别单一芯片依赖!OpenAI 拟开放跨平台 AI 优化工具,剑指英伟达 CUDA

OpenAI 正考虑将其内部开发的跨芯片软件优化工具对外公开,此举若落地,将直接冲击英伟达长期以来凭借 CUDA 软件生态构筑的护城河。

6 月 1 日,据科技媒体 The Information 报道,OpenAI 负责计算与基础设施的高级副总裁 Sachin Katti 在一场公开讨论中表示,该公司正在开发一套软件抽象层,使研究人员和产品团队在运行 AI 工作负载时无需关心底层硬件来自哪家供应商。

当被问及是否会将这一能力对外开放时,Katti 明确表示 " 这在考虑范围之内 ",并将其描述为 "智能体优化能力(agentic optimization capability)",称 " 我们希望将这一能力提供给全世界 "。

分析称,这一表态意义重大。英伟达的市场主导地位长期以来有赖于 CUDA ——这套专有的编译器、函数库与优化工具体系,是主流 AI 开发者在英伟达芯片上运行软件的核心依赖。一旦 OpenAI 的跨平台工具公开发布,将进一步削弱 CUDA 的差异化优势,加速 AI 算力市场的多元化竞争格局。

多芯片战略提速,OpenAI 加速摆脱英伟达依赖

据报道,Katti 在讨论中直言,AI 行业将走向 " 高度异构化 ",各家公司将同时使用来自多家供应商的 AI 芯片。这一判断背后,是 OpenAI 自身战略的深刻转变。

OpenAI 此前几乎完全依赖英伟达芯片,但近期已相继与亚马逊、Cerebras 及 AMD 签署协议,引入其 AI 芯片资源,同时还在自研定制 AI 芯片。

Katti 在讨论中未透露 OpenAI 是否会像 Anthropic 和 Meta 那样采用谷歌的定制芯片。

这一趋势并非 OpenAI 独有。Anthropic 和 Meta 同样不愿在如此核心的业务环节上依赖单一供应商,且没有任何一家供应商能够单独满足其庞大的算力需求。

软件抽象层:谷歌 Borg 模式的 AI 版本

报道称,Katti 将 OpenAI 正在构建的软件体系类比于谷歌著名的 Borg 计算管理系统——后者正是谷歌得以跨异构硬件大规模扩展产品的关键基础设施。" 这就是我们在 AI 领域正在走的路," 他说。

更具颠覆性的是,Katti 暗示 AI 本身将成为打破 CUDA 垄断的工具。" 我们预计将利用 AI 生成优化内核(optimized kernels),从而真正支持所有这些不同的芯片选项," 他表示。

Amp 创始人 Anjney Midha 在同一讨论中指出,如果 OpenAI 这类开发者将此类内部工具公开发布,使 AI 能够高效运行于英伟达、谷歌、AMD 等多家芯片之上,将对英伟达构成实质性冲击。

事实上,CUDA 的护城河已在悄然收窄。Meta 开发的 PyTorch 框架早已让开发者能够更便捷地为多种芯片编写 AI 代码,部分初创公司也在销售 AI 工具,将 PyTorch 代码转译为可直接在芯片上运行的底层代码。

Vera Rubin 芯片部署在即,算力瓶颈转向电力与工程

除软件战略外,Katti 还披露了 OpenAI 在英伟达下一代 Vera Rubin 芯片系统上的部署进展。他表示,OpenAI 已获得该芯片的早期样品,预计将于今年年底将其投入 AI 训练使用。

Katti 对英伟达在 Blackwell 系统推出过程中暴露的问题给予了正面评价,认为英伟达已从中汲取经验。Blackwell 初代系统在规模化部署时曾因网络、固件和布线复杂性令多家云服务商头疼,但新版系统已大幅改善。" 英伟达确实从诸多成长阵痛中学到了东西," 他说。

Katti 未透露哪家云服务商将率先承载 OpenAI 的 Vera Rubin 集群,仅表示各方之间存在 " 良性竞争 "。OpenAI 目前的主要云服务商包括微软、甲骨文和亚马逊。

值得关注的是,Katti 将当前算力扩张的最大瓶颈指向了电力供应与工程能力,而非芯片本身。

" 目前制约我们的更多是电力和工程能力,而非其他," 他说。这一判断对 AI 基础设施投资者的资源配置方向具有直接参考价值。

全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容