月暗与 DeepSeek 的“听牌”时刻

文 | 光子星球

2023 年初，关于 " 谁是中国最有技术理想的人 " 这个问题，十个投资人中大概有一半的回答是 "Kimi（杨植麟）"。

彼时，杨植麟所创建的月之暗面（以下简称 " 月暗 "），跟他本人一样神秘且不按常理出牌。在国内大模型逐渐沦为 " 卷参数 " 的重灾区时，成立半年的月暗开了第一场发布会，侃侃而谈的主题是 " 长文本 "，瞄准的方向是 C 端超级应用。

月暗与 DeepSeek 的第一次 " 撞车 "，发生在 2025 年春节前夕。同一天，间隔不到两个小时，DeepSeek 发布了 R1，月暗发布了 Kimi k1.5。尽管两家模型在训练思路上有相似之处，但 DeepSeek-R1 凭借着模型放量、性能和开源，火遍了全球。

R1 火了，全世界的人都开始打听，DeepSeek 背后的梁文锋是何许人也。《暗涌》2023 年的一篇报道被翻了出来，在里面梁文锋提到了 " 研究 "" 探索 "" 不求商业回报 " 等话题。" 中国最有技术理想 " 的标签，由此被贴到了梁文锋身上。

早期有投资人总结，月暗和 DeepSeek 两家公司的相同点：灵魂人物、一流的技术团队和鼓励创新文化。

就在不久前，月暗面截胡了 V4，先一步发布并开源了新模型 K2.6。

紧接着传出了 DeepSeek 寻求融资的消息，腾讯和阿里巴巴正就投资事宜展开洽谈，而这两家也是月暗的股东。

据有关人士透露，DeepSeek 将以月暗作为部分估值参照基准。目前月暗的估值在 180 亿美元，正在寻求上市。有消息称，DeepSeek 的目标估值已从最初的至少 100 亿美元上调至超 200 亿美元，超过了月暗。

牌局未散，筹码未凉。月暗与 DeepSeek 的故事，像极了麻将桌上的高手对垒。彼此盯着对方的牌，却又各自按自己的牌型摸打。

而麻将的魅力正在于此，不到最后一张牌翻开，谁也不知道谁会 " 点炮 "，谁会 " 自摸 "。

登月的 " 背面 "

去年底，杨植麟对内展现出，公司发展健康，账上资金相对充盈，不着急上市的坦然。

仅过去三个月，情况迎来 180 度转弯，月之暗面被爆出 " 考虑赴港进行首次公开招股 " 的消息。

这一切实际有迹可循，据光子星球了解，去年的月暗内部弥漫着焦虑的情绪。一方面是来自竞争对手的压力，面对智谱和 MiniMax 接连上市，部门员工难免士气低落，因为很多人觉得大模型的窗口期很短，上市的机会稍纵即逝。

另一方面则体现在商业化上，月暗手握的资金、人才在国内属于第一梯队，但核心产品只有 Kimi 助手。这导致其收入来源极其有限，免费用户占绝大多数，付费订阅转化率低，API 调用量远不如专注于 B 端的公司。

有业内人士告诉我们，因为此前的误判，月暗卷入了与大厂的竞争中，结果是在国内没有打过豆包，同时又错过了海外市场开拓时间点。

" 海外相对还是充分竞争的市场，不仅仅有 GPT 和 Gemini，如果有大量全球客户愿意为国产大模型买单，仍是有很大的市场。在进一步打开市场的前提下，大模型和应用的研发才能走向正向循环 "。该业内人士表示，目前有效出海的领域是 AI 视频领域，类似于一些创业公司体量虽小，却仍可与大厂抗衡。

DeepSeek R1 给行业敲响了警钟，包括月暗。

技术战略上聚焦 Agent 方向，Agent 赛道所需要具备的长上下文记忆、任务拆解与规划、底层模型推理能力，恰好与其技术储备相吻合。

按杨植麟所说，Kimi K2.5 以后进化逻辑，按照 Token 效率、长上下文以及智能体集群，三个维度的协同推进。他判断，未来智能发展方向将从单智能体向动态生成的集群进化，这也为 K2.6 埋下了伏笔。

尽管 Kimi 助手还可以免费使用，但对高价值用户筛选极其明显。有很多用户反映，在未充值会员的情况下，正常使用 Kimi 的速度明显变慢，还经常遇到高峰算力不足的问题。事实上，这本身就是月暗的策略之一，在有限算力的情况下瞄准能带来付费转化的生产力用户。

这种策略加速了 Kimi 商业化模型走向闭合。早期，Kimi 没有完全开放收费，仅推出了打赏功能，本质是高峰期优先使用权，更像是一种对免费用户的流量调节手段，而非真正的产品分层。

去年 9 月，随着 "OK Computer" 功能推出，转为 49、99 和 199 元 / 月三档会员，开始将深度研究、K2 Turbo、长思考等能力打包，初步尝试按能力付费。

现在，其会员订阅进一步细分为四档，价格带大幅拉长，最高档接近 700 元 / 月，远超此前 199 元的上限，新增的高阶权益明显指向专业用户和企业级场景。

其定价逻辑不再基于能否使用，而是基于，用户能调动多少 Agent、访问什么级别数据库、获得多少并行能力。这标志着 Kimi 彻底放弃了与豆包等 C 端产品的流量竞争，转而深耕专业生产力市场，试图从高价值用户的付费中获取可持续收入。

K2.6 是分水岭

总体来看，此次 K2.6 的更新，对 Agent" 动手 " 能力的增强，大于对 " 大脑 " 智力的加强。

K2.6 的能力在搜索型 Agent、长链路编码、工具协作这些需要执行与检索的任务上，已经达到和 GPT 5.4、Claude Opus 4.6 同一水平线；但在纯推理、纯数学，这类更依赖内部思维链与抽象逻辑的任务上，还有一些差距。

技术报告里展现了三项 K2.6 的核心能力。一是长程编码能力，能够连续编码 13 小时，编写或修改超过 4000 行代码，堪称 " 编码劳模 "。官方实测中，用较为冷门 Zig 语言重构 AI 模型推理，将速度从 15 tokens/s 提升至 193 tokens/s。这是典型的 " 以执行代推理 " 的优势体现。

二是从单兵到军团的 Agent 集群能力，这是增强 " 手 " 能力的集中体现。K2.6 支持的 Agent 集群架构，能调动高达 300 个子 Agent 并行工作，完成 4000 个协作步骤。相比上一代，任务完成度和交付质量都有提升。

三是 Agent 的自主执行能力，模型能在主动式 Agent 框架，如 OpenClaw，中持续自主运行长达 5 天。这意味着它能作为 7x24 小时的后台 " 数字员工 "，处理复杂任务。

此次以 K2.6 为标志的更新，清晰地揭示了月之暗面一次重大的战略转向：从 " 信息容器 " 彻底转向 " 执行引擎 "，从追求对话智能，全面押注于能直接交付结果的 Agentic 智能。

回顾 Kimi 的一路来的升级，经历了 3 个阶段。

早期的 Kimi 聚焦超长文本和对话，就像一个知识渊博的图书管理员，你问什么，他告诉你在哪本书的哪一页。这是一个信息容器，用户把大量信息倒进去，Kimi 负责理解、检索、总结。它不改变外部世界，只改变用户对信息的获取效率。

第 2 阶段，也就是 K2、K2.5 时期，核心是增强代码生成、数学推理、复杂指令遵循等能力。此时的模型从 " 读 " 走向 " 算 "，就像一个聪明的实习生，他能根据需求写出可运行的代码，但需要你检查、部署和整合。这背后，是模型开始具备工作记忆与链式思考能力，不再只是被动回答问题，而是能主动规划多步骤的思维过程。

第 3 阶段，也就是现在的 K2.6，走向了多 Agent 协同执行。核心是将一个复杂任务拆解为多个子任务，调度不同的 " 技能 Agent" 并行执行，最后整合交付完整成果。K2.6 从一个大脑变成了 " 一个项目经理 + 一支数字员工团队 "。

正是因为智能带来的生产力提升，带来了月暗商业模式的转变，从对功能收费转变为执行任务、成果交付的收费。对月暗来说，K2.6 的商业价值高于技术价值。

这是一道分水岭，是 Kimi 从 " 信息容器 " 迈向 " 执行引擎 " 的拐点，也是 Agent 能承担复杂工作的量产证明。

月之暗面官方在开篇引用了 Linux 之父的一句经典名言，"Talk is cheap. Show me the code"。或许，还应该补上一句 "Only results matter."

V4 狭路相逢

狼来了的故事终于有了结尾，DeepSeek-V4 预览版在 K2.6 之后，姗姗来迟。

根据官方信息，V4 版本的更新核心是 " 普惠 "。通过技术创新，让顶尖的 Agent 能力、百万级超长上下文和极致的推理性能，以更低的成本被每个人和企业方便地使用。

V4 在成本效率上做出了极致优化。采用 MoE 架构，总参数达到 1.6 万亿，但每次推理仅激活约 490 亿参数，既保证了性能，又控制了成本。上下文窗口从前代的 128K 扩展至 100 万 Token，接近 10 倍的量级提升。同时，实现了在 100 万 Token 长度下的 97% 信息召回率。

V4 最具冲击力的，可能不是其技术参数，而是在商业模式上对现有闭源巨头的挑战。

DeepSeek-V4 的采取双版本定价策略，一端是面向个人开发者的 V4-Flash，每百万 tokens 输入是 0.2 元，输出是 2 元；V4-Pro 每百万 tokens 输入是 1 元，输出是 12 元。粗略估算，以 OpenAI 和 Anthropic 当前最强的旗舰模型为基准，其价格大约是 V4-Pro 的 16-25 倍。

Deepseek 表示，受限于高端算力，目前 Pro 的服务吞吐十分有限，预计下半年昇腾 950 超节点批量上市后，Pro 的价格还会大幅下调。

关键是，V4-Pro 并非廉价替代品。其在 Agentic Coding 评测中已达开源最佳，其使用体验优于 Sonnet 4.5，交付质量接近 Claude Opus 4.6 的非思考模式。

同样是 Agent，DeepSeek V4 与 Kimi K2.6 的本质区别，在于它们优化 Agent 能力视角截然不同：一种是微观智能驱动力，一种是宏观集群执行力。

DeepSeek 的内在哲学是模型即 Agent，侧重于单兵为王，通过提升模型自身的智能与效率，使单个 Agent 能力最大化。V4 假设单个模型的能力做到天花板，那么基于其构建的 Agent 自然就是最强的，用户不需要复杂的集群调度，一个 Agent 就能完成大多数任务。

Kimi K2.6 则更偏重于 Agent 即系统，将 Agent 拧成一股绳，核心能力源于多 Agent Swarm 集群的协同能力。K2.6 认为现实中的复杂任务，靠一个 Agent 串行完成太慢、太容易出错。不如拆成几百个小任务，让上百个 Agent 并行一起做，最后汇总。即使每个 Agent 的智商不是顶尖，团队协作的效率也远超单兵。

这两种路线并非对立，而是互相补充。前者拼智商，后者拼协作。前者是深度，后者是广度。因为一个理想的 Agent 系统，可以用 DeepSeek V4 作为子 Agent 的 " 大脑 "，再用 Kimi 的集群框架将这些子 Agent 组织起来。

从种种迹象来看，DeepSeek 正在向资本和商业化靠拢，而且无法避免地将月暗拉进了这场风暴。

智谱与 MiniMax 已经上市，从团队基因、技术能力、融资能力等多个因素综合考虑，月暗成为了 DeepSeek 锚定估值的最佳标的。

目前，月暗的核心叙事是 " 长上下文本 +Agent 集群智能 "，以此支撑起 180 亿美元的估值。DeepSeek 此时以 200 亿美元甚至更高的目标估值去参照月暗，直接挑战了其估值的合理性。

投资者天然会进行同类比较，更何况月暗与 DeepSeek 本来就有相似的地方。当月暗从唯一的选择变成了可替代的选项之一，估值逻辑就从稀缺性溢价，就切换为可替代性折价。

DeepSeek 这局牌打得极凶，技术一把梭哈，定价直接 " 截胡 "，估值有机会反超月暗。

可它的软肋也很明显，开源是把双刃剑，容易养大了对手饿死了自己。其长期以 AI 实验室自居，以研究为导向，无法保证更新频率的稳定性。V3 版本发布于 2024 年 12 月，V4 版本频频跳票，市场等得心焦。

因为坚持开源，DeepSeek 难以通过模型授权收费，收入来源现在只有微薄的 API 调取费用。商业模式尚未建立，仍要面临算力、人才争夺和基建建设等高昂的成本支出。

月暗虽被 " 截胡 "，却还攥着几张暗牌，比如 Agent 集群的工程成熟度、垂直行业的深耕、初步有成效的 Agent 商业模式，这些 DeepSeek 短期难以超越。

谁能把手里的牌打成 " 自摸 "，看的不是谁嗓门大，而是谁能在商业化这张牌桌上，把技术真正换成筹码。

DeepSeek 摸到了 " 听牌 " 的资格，月暗也还有 " 改听 " 的机会。只是这张牌桌，从此再无轻松的牌可打。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

月暗与 DeepSeek 的“听牌”时刻

宙世代

一起剪

相关阅读

三星Galaxy Z Fold Wide尺寸数据曝光 阔折叠成员+1

腾讯大模型重回牌桌了吗？

DeepSeek-V4发布，黄仁勋的担忧成真了

抖音本地生活“断舍离”

月暗与DeepSeek的“听牌”时刻

DeepSeek V4一发布，黄仁勋的预言成真了。

豆包大模型接管的车机，快成精了。

手机电池越来越不耐用，真是“计划报废”在发力？

土耳其爆款工厂牵手西班牙长寿剧之王：38年黄金档神话遇上全球输出冠军

前华纳高管押注土耳其：首部合拍剧《Caged Love》开机，瞄准全球1.5亿观众市场

腾讯发布出行全场景智能体开放平台，推动车载AI从“对话”转向“主动执行”

“宇宙级”大计划！“天地一张网”，来了

Intel这次真的行了：还在开发中的14A工艺良率、性能就已超越18A

MiniMax 登上戛纳，AI 与艺术的全球和解开始了？

商业航天又一重磅！标准体系来了，产业有规可循

最新评论

钛媒体

热门推荐

企业资讯

三星Galaxy Z Fold Wide尺寸数据曝光阔折叠成员+1