文 | 新眸,作者 | 李小东
最近这段时间,不管是硅谷的开发者邮件组,还是国内的技术社群,话题几乎都绕不开两个消息。
一个是 OpenAI 正式确认,代号 Spud 的新一代大模型 GPT-6 即将全球发布;另一个是这家公司在发布前,亲手关停了一年前引爆全网的视频生成产品 Sora,连 API 都定了全面下线的时间表。
不少做 AI 开发的朋友,这两周都在调整手里的项目节奏,等着看 GPT-6 的发布文档,也有人在聊,OpenAI 这步棋走得太急,毕竟 Sora 上线的时候,几乎重新定义了 AI 视频生成的标准,怎么说停就停了。
其实比起 GPT-6 到底能把参数堆到多少,推理能力提升了多少,更值得琢磨的,是 OpenAI 在这款模型发布前做的一系列选择,以及整个 AI 行业,在这场发布会到来之前,悄悄发生的那些变化。
01 GPT-6 的底色与 OpenAI 的转身
前两天 OpenAI 的官方公告里,关于 GPT-6 的信息并不算多,只明确了预训练工作已在德克萨斯州的 Stargate 数据中心全部完成,目前进入最终的安全对齐与 API 调试阶段。
更多的细节,来自核心管理层对外的零星表述。
OpenAI 总裁 GregBrockman 在近期的播客访谈中亲口确认了 GPT-6 的存在,他的表述里没有常见的参数堆砌,只留下一句关键的判断:这次不是增量改进,他们思考模型开发方式已经发生重大改变。
SamAltman 则在给全体员工的内部信中,将这款模型定义为 " 一个非常强大的模型,可以真正加速经济发展 "。
从行业渠道流出的测试信息来看,GPT-6 的核心升级,确实跳出了过去几代模型的惯性路径。它采用全新的 "Symphony" 架构,首次实现了文本、图像、音频、视频的原生统一处理,而非行业内常见的多模态模块拼接。
这意味着,用户无需再通过插件跳转,就能用手绘草图直接生成前端代码,上传一段视频就能拆解动作细节并生成对应脚本,甚至用语音指令完成从创意构思到视频成片的全流程操作。
开发者最关注的编码、推理和 AI 智能体任务上,GPT-6 较 GPT-5.4 实现了 40% 以上的性能提升,上下文窗口从 100 万 token 直接扩展至 200 万,单次可处理约 150 万字的文本,相当于两部中篇小说的体量。
公开的测试数据显示,其数学推理准确率达到 92.5%,代码生成通过率 96.8%,在 44 类职业测试中,83% 的任务表现达到或接近人类专家水平。
更值得关注的,是 OpenAI 为这场发布做的一系列前置动作,尤其是对 Sora 的全面关停。我记得 Sora 刚出现的时候,被行业称为 " 重磅炸弹 ",不少做视频创作的朋友,当初都为 Sora 的能力惊叹过。
但文本生成视频这件事,能成为真正意义上的商业项目的,确实少之又少。要么是生成的内容版权说不清,要么是成本太高,远不如人工制作可控。
这也是 Sora 最终走向关停的核心原因。《福布斯》杂志的估算数据显示,Sora 项目每年的运行成本高达 50 多亿美元,而自上线以来,应用程序内总收入仅约 210 万美元,完全无法覆盖高昂的算力与运营成本。
和文本生成不同,AI 视频生成对算力的消耗呈指数级增长,单段 10 秒的基础视频生成成本约 1.3 美元,复杂场景的成本甚至能达到 33 美元。
为了控制亏损,OpenAI 不得不不断削减用户的免费生成额度,从最初的每日 30 条降到每日 6 条,进一步加剧了用户的流失。Appfigures 的监测数据显示,Sora 的 30 天留存率仅为 1%,60 天留存更是趋近于零,用户尝鲜过后,几乎没有持续使用的动力。
压垮 Sora 的还有版权与合规的重压。上线初期,Sora 凭借生成迪士尼 IP、名人形象的视频快速出圈,也随之引发了大量的版权诉讼与行业抵制。
OpenAI 被迫将内容生成规则从 " 默认可用 " 收紧为 " 需明确授权 ",直接砍掉了产品最核心的吸引力,与迪士尼的 10 亿美元合作也随之终止。而深度伪造内容的泛滥,更是让 OpenAI 持续面临监管层面的压力,美国非营利组织 " 捍卫公众利益组织 " 曾专门致信,要求其下架 Sora。
当然,也有人判断,OpenAI 冲刺 IPO 在即,这家公司在 2026 年 2 月底完成了新一轮 1220 亿美元的私募融资,估值达到 8520 亿美元,计划在 2026 年第四季度正式登陆资本市场。对华尔街的投资者而言,一个持续烧钱、看不到盈利前景的视频生成项目,远不如一个能带来稳定现金流的企业级生产力模型有吸引力。
而高盛则测算,2025 年 OpenAI 全年收入超过 200 亿美元,但亏损仍高达 140 亿至 150 亿美元。想要满足上市的盈利预期,OpenAI 必须把有限的资源投入到最具商业价值的业务上。
就现在来说,企业级服务正是当下 AI 行业最确定的现金牛,Anthropic 的年度收入超过 190 亿美元,其中约 80% 来自企业客户,这给 OpenAI 带来了直接的竞争压力。
关停 Sora,全力押注 GPT-6,本质上是 OpenAI 在上市前夜,对自身商业叙事的一次重塑。
从过去用炫酷的生成能力吸引 C 端用户,转向用稳定、高效的生产力能力服务 B 端企业,从 AI 技术的探索者,转向 AI 商业化的落地者。而 GPT-6 的登场,正是这场转型的核心载体。
02 AI 赛道,不是单线程的赛跑
就在 OpenAI 为 GPT-6 的发布紧锣密鼓筹备的同时,全球 AI 行业的其他玩家,并没有跟着它的节奏起舞,反而提前开启了新一轮的布局。
4 月 2 日,谷歌 DeepMind 正式推出 Gemma4 系列大模型,以 Apache2.0 协议完全开源,四款模型覆盖从手机端侧到云端推理的全场景。
其中 20 亿参数的 E2B 模型,内存占用低至 1.5GB,可在智能手机、树莓派上离线运行,性能却追平了上代 270 亿参数的模型;310 亿参数的稠密模型,在 ArenaAI 排行榜上位列开源模型第三,直接碾压多个参数量是其 20 倍的竞品。
开源社区的反应很直接,发布当天,HuggingFace 上相关的衍生模型就破了千个,很多做端侧 AI 开发的团队,直接把之前的模型方案换掉了。谷歌官方公布的数据显示,Gemma4 发布 24 小时内,总下载量就突破 4 亿次,衍生模型超过 10 万个,在开源社区掀起了一场新的狂欢。
谷歌的这一步棋,恰好走在了 OpenAI 的反面,当 OpenAI 用闭源的 GPT-6 向 AGI 发起冲刺时,谷歌选择用开源的方式,把 AI 能力下放给全球的开发者和设备厂商,抢占端侧 AI 的入口。
Gemma4 的核心突破,就是让大模型彻底摆脱了云端算力的束缚,手机、IoT 设备、汽车都能在本地实现全功能的 AI 推理,未来的 AI 竞争,不再只是云端大模型的参数竞赛,更是端侧设备上的生态争夺战。
国内大厂的动作同样密集。就在谷歌发布 Gemma4 的同一天,阿里正式推出通义千问 Qwen3.6-plus,在全球权威编程榜单 CodeArena 中表现亮眼,在考察复杂 web 开发自主编码能力的 react 专项榜单中位列全球第二,超越了 OpenAI 的 GPT-5.0-high 和谷歌的 Gemini3.1pro,仅次于 Anthropic 的 Claude-opus-4.6。
字节跳动则在今年推出豆包 2.0,支持私有化部署,满足企业数据安全和合规需求,同时公布豆包系列产品跻身全球 AI 助手第一梯队。行业内流出的数据显示,豆包大模型的日均 Token 消耗已达 120 万亿,较初期增长了 1000 倍,三个月内实现了翻倍。
腾讯则在 3 月下旬为微信全量推送了 ClawBot 插件,原生接入 OpenClaw 开源 AI 智能体框架,让 12 亿用户的微信聊天框,直接变成了可自主拆解复杂任务的 AI 控制台。
微软的动作更值得玩味。前不久微软正式推出 MAI-Transcribe-1、MAI-Voice-1 与 MAI-Image-2 三款自研商用模型,覆盖语音转写、语音生成与图像生成三大核心场景。这三款模型由微软 MAI 超级智能团队开发,意味着在与 OpenAI 的合作之外,微软正在加速构建自研的 AI 模型体系,减少对外部技术的依赖。
整个 AI 行业,正在 GPT-6 即将掀起的浪潮前,形成了清晰的路线分化。
OpenAI 沿着闭源的路线,全力向 AGI 的终点冲刺,试图用下一代模型重新定义行业的天花板;谷歌、阿里等厂商则用开源的方式,构建更广泛的开发者生态,抢占端侧 AI 的未来;微软、腾讯等巨头,则依托自身的产品生态,把 AI 能力深度融入现有的用户场景,实现技术的快速落地。
这场持续了三年多的 AI 竞赛,早已不是单线程的赛跑。
03 落地的修行,是比参数更重要的事
从 2022 年底 ChatGPT 发布至今,三年多的时间里,AI 行业经历了一轮疯狂的参数军备竞赛,各家厂商争相发布更大参数、更高精度的模型,但事实上,却很少真正沉下心来解决 AI 如何落地的核心问题。
多数大模型仍停留在聊天机器人的阶段,除了少数科技企业和开发者,绝大多数普通用户和传统行业,并没有真正享受到 AI 技术带来的效率提升。
GPT-6 的到来,单从当前的寥寥信息推断,似乎能够为这场竞赛重新划定赛点。整个行业的竞争焦点,从 " 能不能做出来 ",转向 " 能不能用起来 "。
无论是 GPT-6 对智能体能力的深度整合,还是 Gemma4 对端侧部署的极致优化,亦或是 Qwen3.6-plus 在编程场景的深度打磨,本质上都是在让 AI 技术走出实验室,真正融入到具体的工作场景中,变成能解决实际问题的工具。
对国内的大模型厂商而言,GPT-6 的发布既是挑战,也是全新的机会。过去几年,国产大模型始终处在追赶者的位置,跟着海外厂商的节奏,在参数和精度上不断追赶。但随着 AI 行业的赛点转向落地与生态,国内厂商依托本土的场景优势、用户基础和产业链资源,反而有了实现差异化突围的可能。
从企业服务厂商从业者那里了解到,目前国内制造业、金融、零售等传统行业,对 AI 的需求正在快速爆发,但他们需要的不是一个无所不能的通用大模型,而是能解决行业具体痛点的垂直解决方案。
比如制造业的质检与生产流程优化,金融业的风险管控与客户服务,零售业的用户运营与供应链管理,这些场景都需要 AI 模型深度结合行业知识,而这正是国内厂商的优势所在。
而对普通的开发者和用户来说,的确不用过度焦虑 GPT-6 会不会带来行业颠覆,也不用执着于追逐最新的模型版本。
大家都能够意识到,真正有价值的,是学会把这些 AI 工具,变成自己工作里的帮手。AI 的出现不应该是为了替代人,它能做的,是把人从重复繁琐的工作里解放出来,去做更有价值的事。
GPT-6 的发布会再过几天就会到来,它也许真的会刷新我们对 AI 能力的认知,也会给行业带来新的变化。
但我们也认识到,即使 SamAltman 曾经说过,AGI 会是人类文明史上最重要的事件之一,但在那个遥远的终点到来之前,整个行业,还有我们每一个人,都要先完成一场更务实的修行。