文 | 浪潮不癫
过去一年,在 AI 上,没有人比扎克伯格遭遇更多的嘲笑。
在 Llama 4 刷榜造假、Meta 被认为 AI 掉队后,小扎确实急了。
先是花了 143 亿美元收购 Scale AI 49% 的股份,直接把人家 28 岁的创始人 Alexandr Wang 给收编了,任命他为 Meta 有史以来第一位首席 AI 官,同时成立一个 " 超级智能实验室 " 的新部门,开启一个内部名为 " 牛油果 " 的项目。
接着又挥舞钞票,到处天价挖人,从 OpenAI 挖来赵晟佳,从苹果挖来庞若鸣,还有中科大少年班的余家辉,据说个个年薪过亿美元,批量生产打工皇帝,直接把 AI 人才竞争的入场券抬到亿级。
钱多人傻、内部宫斗,原来的 AI 大佬杨立昆出走,这一年来,Meta 戏码不断,甚至传出小王同学要被干掉,逼得小扎晒出俩人合影辟谣。
终于!九个月后,小王同学端出了这个 " 牛油果 " ——全新的 AI 模型 Muse Spark。
谈不上是一个 " 王者归来 " 的故事,Muse Spark 不是一个炸裂的模型,长处与短板都很明显,在多模态理解、健康问答断层第一、深思模式在前沿科学表现好,但在抽象推理、coding 能力上,还是远远落后于 Claude 和 Gemini 这些老对手。
外界居然很买账,Meta 股价当天涨了 9%,创下今年 1 月以来最大单日涨幅。对于 Meta 这次的诚恳态度,包括重构后的技术路线,也都挺认可的。
可以说,Meta 这段经历,其实是给整个大模型行业上了一堂公开课,关于翻盘的公开课。
纠错速度比初始选择更重要
大模型竞赛最反直觉的一点是:你之前积累了什么,可能完全不重要。
Meta 在 Llama 系列上投入了海量资源,但 Llama 4 翻车之后,扎克伯格并没有在原有技术栈上修修补补,而是做了一件极其痛苦的事:推倒重来。换帅,换组织,换架构,换路线。九个月,从零开始,重建一整套技术栈。
这对行业的启示很直接:在大模型时代,沉没成本就是沉没成本。你之前训了多少参数、堆了多少算力,方向错了就是错了。很多团队不缺 GPU 不缺人才,缺的是那个砍掉重来的决策魄力。钱能解决的问题,从来不是最难的问题。
小王在入职后的第一次全员会上说了一句话:" 我们不会在别人的地基上盖楼。" 这话当时听着像 PR,现在看来他是认真的。Muse Spark 是一个从底层重写的原生多模态推理模型,跟 Llama 系列几乎没有代码层面的继承关系。
这种 " 敢归零 " 的能力,本身就是一种稀缺竞争力。
执念是用来放下的
Meta 做对的第二件事,是同时放下了两个执念。
第一个,是对开源的执念。
Meta 曾经是 AI 开源世界里头号旗手,Llama 系列的在开源社区至今都有很大影响力。但 Muse Spark 直接发布为闭源模型,以 API 形式开放。这个转向让很多人意外,甚至有人觉得背叛了开源社区。
但如果冷静想一下就会明白:开源从来不是价值观,是竞争策略。建生态的时候,用开源拉盟友,你的模型越多人用,你就越像标准。但当大模型行业从 " 技术布道期 " 进入 " 商业回报期 ",研发成本飙升、技术保鲜期缩短,token 经济成为新叙事支点之后,旗舰模型的闭源几乎是必然选择。
Meta 的切换说明一个趋势:" 开源即正义 " 的叙事,在 AI 竞赛的白热化阶段开始松动了。未来更可能的格局是混合路线—— 8B、32B 等中轻量级模型继续开源,数万亿参数的顶级旗舰模型转向闭源,作为云端服务的独家卖点。
第二个被放下的执念,是大模型对 " 全面碾压 " 的追求。
Muse Spark 的跑分成绩单非常有趣:医疗推理断层第一(HealthBench Hard 得分 42.8%,GPT-5.4 只有 40.1%),图表视觉理解大幅领先(CharXiv Reasoning 得分 86.4),但编码能力(SWE-Bench 77.4%)和抽象推理明显落后于 Claude 和 Gemini。
这不是一个 " 什么都行 " 的模型,而是一个 " 在特定方向上极其锐利 " 的模型。
为什么选医疗和视觉?因为这是 Meta 的产品生态最需要的能力。Meta AI 眼镜需要强大的视觉理解来识别现实世界;WhatsApp 和 Instagram 上的 30 亿用户需要可信赖的健康建议。更关键的是,Meta 把十亿级的社交图谱—— Instagram 的创作者内容、Facebook 的社群数据——整合进了 AI 回答。这是 Google、OpenAI 和 Anthropic 都没有的。
" 全面碾压 " 的时代已经过去了,适合自己的才是最好的模型。
当头部模型的通用智力越来越接近,真正拉开差距的是你有什么别人没有的。Meta 找到了自己的不对称优势:独有数据、独有场景、独有生态。
这对所有在做大模型的团队都是一个灵魂拷问:你独特的场景、生态和数据是什么?如果答不上来,光靠堆参数跑分是跑不出护城河的。
节奏感比完美度更值钱
Meta 这次最聪明的一手棋,是没有憋大招。
Muse Spark 被 Meta 自己定义为 " 起步款 " ——用来验证技术栈可行性的,不是性能天花板。用一个更直白的说法:这是一发信号弹,不是核弹。
但就是这发信号弹,达到了它需要达到的所有战略目标:股价涨了 9%,投资人信心回来了;团队士气回来了;行业叙事从 "Meta 掉队 " 变成了 "Meta 回来了 "。然后 Meta 可以沿着预训练效率(算力需求减少 90%)、强化学习、推理时计算三条轴线慢慢放大,一步一步出牌。
这反映了大模型竞赛的一个深层变化:从 " 一发入魂 " 变成了 " 持续出牌 "。
GPT-4 发布的时候,整个行业被震撼,那是 " 一发入魂 " 时代。但现在,每家都有强模型,每个月都有新发布,用户和投资人的阈值越来越高,注意力窗口越来越短。你藏着掖着等 " 完美时刻 " 再发布?对不起,市场不会等你。投资人要看季度进展,团队要看方向确认,用户要看实际产品。
先出牌,证明你还在牌桌上。再用路线图告诉市场你会越来越强。节奏感,比完美度更有价值。
这可能也解释了为什么 Meta 要把这个系列叫 "Muse" ——缪斯是灵感之神,不是宙斯。它代表的不是终极力量,而是持续创造的开始。
做错的人还有机会,这让人欣慰
把 Meta 这九个月的故事串起来,你会发现一个清晰的逻辑:
先敢归零——这解决的是生存问题。方向错了就认栽,别在烂地基上盖楼。
再找到自己独有的不对称优势——这解决的是定位问题。别追求什么都强,想清楚你有什么别人没有的。
最后用节奏感持续出牌——这解决的是持久战问题。先亮相,再加注,让市场跟着你的节奏走。
这三层加在一起,其实就是一个在高度不确定环境下的生存公式。它不只适用于大模型竞赛,适用于所有技术换代期的竞争。
当然,Muse Spark 只是 Meta 翻盘故事的第一章。接下来小王能不能兑现 " 越来越强 " 的承诺,小扎能不能把 2026 年预计 1150 亿到 1350 亿美元的 AI 支出转化成真正的护城河,这些都还是未知数。
但至少有一件事是确定的:在 AI 行业," 做对选择 " 很重要," 做错了之后还能站起来 ",可能更重要。
毕竟我们都是人,都会犯错。