等待 DeepSeek 的 145 天

DeepSeek 的拥趸正在流失。

至少在 2026 年 4 月 24 日之前，是这样的光景。

过去几个月里，不少以 DeepSeek 为主题，缀以 " 布道者 "" 走向未来 "" 铁粉 " 等的账号停更、转型。在不同的社交平台上，针对 DeepSeek 的失意之语，叠加了意思若有若无的落寞，" 为什么 DeepSeek 会变成这样了 "。

原本不是这样的—— 2024 年底至 2025 年初接连 V3 和 R1 后，这款中国 AI 模型红遍全球，诸多光环加身，赢得一众拥趸。

" 早期对比过后，很明显 DeepSeek 在生成中文对话，甚至铺排情节、预写方面都是最强的。没那么多 AI 味，水文的比例更少。" 一位自称 " 忠粉 " 的用户王冰（化名）曾如此总结，他与 DeepSeek 结缘于副业：用后者调试自己创作的网络小说。

长期的对话与助益，也让他对 DeepSeek 的认同感愈发深入，会在各类场合积极为自己的 " 偶像 " 说话甚至与人争吵。当然，" 理想主义 "" 颠覆者 "" 国产之光 " 等标签，也让当一名 DeepSeek 粉丝被赋予了更多的意义。

裂缝出现在今年 2 月，一次更新后，DeepSeek 输出的内容突然变得陈腐、老套，无论怎么调整提示词，效果都不理想。更多用户反馈 DeepSeek 变冷淡了，缺少温度甚至 " 登味十足 "，包括所谓 " 粉丝 " 在内的一些社群甚至兴起了 " 联名书 " 项目，希望在各渠道发声让 DeepSeek" 找回自己 "。

DeepSeek 自己生成的答案一度被当作官方回应：并非刻意冷淡，而是因为效率上的调整和对边界感的注重。

" 挺不好受的，想脱粉的肯定不少，但我觉得还要等 "，王冰说。

愿意留下来的人，等的正是 V4 的发布。作为同样需要经营自己读者的网文创作者来说，这一回答可能比事实本身更让人失望，但因为有更大的事件即将到来，关注和期待仍然持续。

事实上，关于 DeepSeek V4 的上线时间，一直牵动人心。从去年 12 月 1 日 V3.2 正式版发布后，DeepSeek 就 " 断更 " 了，但 The Information 等媒体早已 " 预告 "，这家公司会在春节期间发布 V4。不少人满怀期冀，畅想一年前的 "DeepSeek 时刻 " 再次上演。

外界的期待在膨胀，但故事的主角，却愈发沉默。

今年初接连发布两篇重要论文后，DeepSeek 几乎缺席了这个冬春之交的所有重要事件。

春节大战、龙虾 Agent，AI 世界的主线剧情频繁切换，而 DeepSeek 的故事线，却始终若即若离。

渐渐地，人们适应了 DeepSeek 的缺席。而等待，也已变成了一种习惯。

网文作者在等待中尝试了很多其他工具，包括频繁迭代的国产大模型、专门辅助创作的 Agent 等等。

" 重新用起来才发现，AI 能力发展得太快，认为 DeepSeek 一直有独一无二的优势，才是幻觉吧。" 袪魅来得有些突然，但似乎也顺理成章，甚至都没等到新模型的正式发布。

如今看来，所有人等待 DeepSeek，并不仅仅是等待这个大模型本身——人们等待的，是一个新的高光时刻，正如一年多之前，那个被标识为中国 AI 的 " 破圈 " 的时刻。

那时，对于更广泛的国内受众来说，ChatGPT 等顶级大模型的能力仍是 " 只闻其名，未见其实 "。即使只是聊天，能多数能用到的模型也不尽如人意，它们无论在性能、知名度还是期待值上，都囿于有限圈层内。

直到 DeepSeek 横空出世，在那个氛围感十足的春节档，才让人们看到了 AI 会思考、说人话，甚至能干活，这是本土产出的大模型第一次具备比肩全球顶级的性能。对于很多人来说，这是第一次真正接触 AI，除了手机里多了一个 App，生活、生产方式也开始悄然变化；对于很多人来说，大预言模型、提示词、训练与推理等 AI 术语第一次有了实体，甚至不少人对复杂的参数和 Benchmark 的榜单有了兴趣。

这缘于 DeepSeek，行业也在这种气氛下加速。竞争激烈了起来，大家都在加速，DeepSeek 却好像慢了下来。

在漫长的等待中，他们会通过各种契机接触到所谓 " 竞品 " 或新事物，并惊觉它们能够填补那个缺席的空洞。

而即使对于更为硬核的开发者、业内人士，对 DeepSeek 的看法和心态，似乎也已被重置。

4 月 24 日，V4 终于正式登场，人们等来了新的世界最强开源模型，等来了大幅提升的 Agent 能力，也等来了 " 国产模型 + 国产芯片 " 的深度适配。

如果回到 V3.2 发布时的节点来看，这似乎正是曾经的期许。

但社群、评论区的关注已不在此，一些不满的声音认为 DeepSeek 在 " 固步自封 "，而且没有在自己专精的道路上真正挤进 " 最强梯队 "。而关于迟到的原因与代价，包括与国产算力的深度绑定，也愈发成为争议焦点。

两次更新之间，145 天过去了，DeepSeek 还在 " 深度求索 " 那个答案，关于颠覆性创新、关于开源生态、关于 AGI。

可它面对的问题，却变了。

气氛到了，V4 却没来

在等待 DeepSeek 的时间里，AI 行业发生了很多事。

最新的感知是，AI 需要赚钱了。

这是 2025 年底到 2026 年初行业最重要的事情。

Meta 重金收购 Agent 初创公司 Manus，无疑是其中最大的故事。后者是 2025 年继 DeepSeek 后又一个引发全球关注的由中国团队主导的 AI 公司。

这一年，始于 DeepSeek 横空出世，终于 Manus 委身巨头。

跨年后，剧情再次加速。1 月 8 日，智谱率先敲钟，Minimax 次日挂牌——自此，大模型厂商有了明确的市场价格，而且将不断接受 " 何时盈利 " 的诘问。

作为全球风向标的 OpenAI 和 Anthropic，也都在开年宣布入局 "AI+ 医疗 "，前者还启动了广告业务。

相较于迭代速度和性能指标的较量，模型发布时的 " 商业变现 " 能力被更加凸显了出来，几乎每款重要模型都会精准锁定一些办公或商业场景，锚定更加直接的 " 经济价值兑现 "。

那时的 DeepSeek，仍被认为是 " 合唱 " 的一员。尽管彼时在这家刻意低调的公司身上还看不到太多商业诉求，但其对 Agent 能力、编程等领域的探索，均是行业主流方向。而且，毕竟梁文锋的老本行是量化投资，毕竟，" 把价格打下来 " 这件事，DeepSeek 也一直是最重要的推手。

行业里，几乎每天都有新变化。热闹的间歇，总有人在等着 DeepSeek。

零星的消息偶尔传来。The Information 报道称 DeepSeek 将于 2 月中旬的马年春节前后发布新一代模型，知情人士则透露其主打编码能力，内部初步测试超越了 " 编程之王 "Claude。而在 1 月 1 日和 13 日，DeepSeek 发布了两篇论文，分别聚焦 mHC 和 Engram，解决规模和记忆这两大关键问题，被当作新模型的前奏。

一位开发者回忆称，由于一直在与全球顶级模型 " 掰手腕 "，大家会习惯性地认为 DeepSeek 会与 OpenAI、Anthropic 一直在同一擂台上较量，而且对国产大模型有引领作用。" 提升生产力和实用价值是一定的，至于商业变现，很多人预期 DeepSeek 会在发布新模型的同时找到自己的商业模式，而这并不影响开源的生态。"

一切看起来，都是蓄势待发的模样，但事后看来，很多时间节点，更像是外界强加的想象——那一时期外界 AI 商业化浪潮的冲击，远较 DeepSeek 自己预期的节奏更猛烈。

根据晚点等媒体的报道，王炳宣、魏浩然、郭达雅等核心贡献者在 2025 年底至今年 3 月间相继出走大厂，虽然单看流失率还不到 2%，但此前 "DeepSeek 员工极难挖角 " 的叙事已经松动。而 " 不融资 " 导致员工手中期权兑现无期甚至难以估价，被视为人才流失的重要原因。

在内部，梁文锋开始考虑融资，更多提及产品化，同时还要推进 V4，面对其与国产芯片深度适配的复杂问题；而竞争对手在快速迭代模型，并持续挖角 DeepSeek 的人才……

当然，人们事后才知道这些暗流。但在水面上，仍不乏线索，比如 1 月到 2 月期间 DeepSeek 在模型性能排名、下载量、活跃用户排行榜上出现下滑。而不少外媒和机构也关注到了，这家致力于开发全球最顶尖大模型的公司，在因地缘问题无法持续获取英伟达先进芯片的情况下，可能面临着较为严峻的算力制约。

情况不乐观，但只要 V4 足够强，以那时的氛围来看，就能扭转势头。

1 月中旬起，DeepSeek 鲜少 " 抛头露面 "，被认为进入了重大模型更新前的 " 静默期 "。

1 月下旬至春节前，以 " 龙虾 " 为标志的 Agent —— OpenClaw、字节的视频模型 Seedance 2.0 相继爆火。曾为 DeepSeek 给出高度评价的 OpenAI 联合创始人安德烈 · 卡帕西（Andrej Karpathy）、打造出《黑神话：悟空》的游戏科学创始人冯骥，以类似的风格分别给予了新事物极大赞许。

而在讨论中，它们也常被称作 "2026 年的 DeepSeek 时刻 "，这让属于 DeepSeek 自己的时刻，被愈发寄予厚望。

此后的马年春节，AI 圈愈发不平静，甚至席卷了更多的领域。

Anthorpic 发布的插件导致 Saas 行业遭遇 " 替代危机 "，美股软件板块持续暴跌；而腾讯、阿里、字节、百度等中国大厂则打起了一场耗资近百亿元人民币的 " 春节 AI 大战 "。

气氛烘托到这，人们也一度十分笃定，V4 会在某个时刻登场。

但直到春节结束，人们才真的相信 DeepSeek" 爽约 " 了，尽管官方从未给出过任何发布时间线。

一位 GPU" 小龙 " 公司的研发人员对我们回忆称，为了在 24 小时以内给 V4 做适配，公司提前做了不少准备，假期也一直安排员工待命，但没怎么想到最终会是 " 一场空等 "。

实际上，从芯片、云厂商，到以 DeepSeek 为主模型的腾讯等大厂、竞争对手，以及更渴求用到新品的 AI 应用企业和开发者，都在苦等 V4 的 " 闪亮登场 "。

这种热切到有些焦急的盼望，在 3 月有了归宿，不过主角不是 DeepSeek，而是 OpenClaw。

" 龙虾 " 与 " 鲸鱼 "

OpenClaw 在中国的火爆有些突然。

这只号称让 "AI 长了手和脚，能动手干活 " 的 " 龙虾 "Agent 早在 1 月下旬就从硅谷 " 破圈 "。

但在国内更广泛的知名度，则集中在春节过后，两会期间。

在上海，出现了三百多人排队安装 " 龙虾 " 的景象；在深圳，腾讯在自己的大厦前摆摊派 " 虾 " 吸引了千人到场。有人花 100 多元买 " 站票 " 只为听一堂 " 手把手教养虾 " 的课课程，也有人在闲鱼上做起了上门安装的生意，据说单价都要 500 元，有人月入六位数。

腾讯、字节、阿里等巨头随之下场，密集进行在线部署，并推出了多款 " 虾 " 系产品。

这一切，都像极了 2025 年春节期间，由以鲸鱼为标志的 DeepSeek 所引发的那波热潮。

而很大程度上，正是 DeepSeek V4 的 " 迟到 "，促成了 OpenClaw 的火爆。

那时盛行的一个段子，是美国 AI 在卷技术、卷编程、卷生产力，而中国的春节 AI 大战在卷补贴、卷红包、卷奶茶。

人们在等待一个新的爆款，最好能够代表技术前沿，最好能够许诺开启新的时代，最好还能富有故事性且平易近人。

去年的那条 " 鲸鱼 " 始终不肯浮出水面，积攒的情绪就找到了 " 龙虾 "。它的诞生同样充满了极客精神和戏剧性，甚至多了些游戏感，它还被视作 "AI 进入 Agent 时代 " 的标志性事件。

这个早春需要这只 " 虾 "，即使它是舶来品，即使早在一个多月前就火过一轮了。

端边 AI 芯片厂商后摩智能的一位高管告诉我们，无论是 DeepSeek 还是 OpenClaw，跑通并不是问题。这些新事物的意义更类似 " 风 "，能把芯片、算力企业带到市场面前。

他举例称，DeepSeek V3 问世后，国产推理芯片的商业机会不断释放，与客户的 " 沟通成本 " 降低很多，只要以 DeepSeek 为例，用户就能明白。而 " 龙虾 " 作为一个新物种，也让大家看到了 Agent 是一个确定性的趋势，对于芯片行业来说，它带来的算力需求暴增、轻量化本地化部署场景的增多、对异构计算的推动，都是机会所在。

就连行业老大英伟达也在全速跟进，在 3 月中旬的 GTC 大会上，" 龙虾 " 成为了贯穿全场的主角，该公司推出了自己的 " 龙虾 " 平台 NemoClaw，黄仁勋更是将其作为 "Agentic AI 拐点已至 " 的重要论据。有趣的是，DeepSeek 在 2025 年被称作 GTC 大会上潜在的主角，虽然黄仁勋未过多直接提及，但彼时英伟达芯片在推理场景、MoE 架构上的调整和阐发，背后都是 DeepSeek 的影子。毕竟，它曾经让这个全球市值最高公司的股价一天跌了约 17%。

截图来自英伟达 GTC 大会官方直播视频

当然，" 等风来 " 的不只芯片层，从云、模型，到应用、设备，所有环节都在忙着给自己贴上 " 虾标 "。

" 龙虾 " 产品对大模型的调用量形成了单独的榜单，而 " 龙虾本 "、Agent box 等新的设备也相继走红，就像 DeepSeek 去年爆火时批量面世的 DeepSeek 一体机一样。

而压力，也再次来到了 DeepSeek 身上。

一位开发者解释称，OpenClaw 等 Agent 框架，既依赖大模型进行工作的执行调度，给模型厂商带来 Token 消耗的增量，也在一定程度上能拉平各个模型的性能表现。

频繁更新、更能适配 OpenClaw 的竞争对手，以及手头握有有 " 大龙虾 " 之称的 Codex 和 Claude Code 的 OpenAI 和 Anthropic，在这波浪潮中风头更劲。

而对于仍然只有一个聊天机器人产品的 DeepSeek 来说，人们的兴趣在减弱。这个 3 月，是 " 龙虾月 "，是属于 Agent 的月份，也是 DeepSeek 被谈论最少的一个月。

等待也变得愈发不耐烦，更多对 " 拖更 " 的吐槽冒了出来。就在 V4 发布之前，人们谈论 DeepSeek 的坐标已经不一样了。

答案依旧，问题变了

3 月 29 日晚到 31 日，DeepSeek 连续三天遭遇宕机，最长的一次长达 13 个小时。

较为意外地，对于这次让 DeepSeek 重登热搜的 " 史上最大事故 "，期待甚至盖过了埋怨，业界猜测故障是因 " 为 V4 进行灰度测试 "。至少，DeepSeek 不再沉默，人们始终希望它 " 搞出些大事 "。

果然，在不乏大事件的 4 月，DeepSeek 仍频频成为舆论焦点。

晚点、The Information 等媒体接连发布报道，包括上文提及的员工跳槽大厂、公司寻求首次外部融资等信息为更多人所知。

而且，V4 的发布时间也终于相对可靠地被锚定在了 4 月下旬，据称这是梁文锋在内部沟通中给出的时间，而且得到了多方信源确认。

这让关于 DeepSeek 近况的解析一直持续到 V4 登场。

但是，如果回看 100 多天前的讨论，会发现人们更多会谈及 DeepSeek 将在 Agent、记忆模块和编程等场景上实现哪些技术和性能上的突破。

而在发布前的 20 多天中，经过业内 " 不要抱太高期待 " 的 " 预防针 "，和被视为已具有 V4 基因的网页版、APP 并不惊艳的表现，技术和性能层面的讨论变得越来越少。

而被推向台前的，一是 DeepSeek 的融资和估值；二是与国产算力的深度适配；三是这家公司将何时及如何开启模商业化变现之路。

从目前的信息来看，融资金额尚无定论，流传较多的是 200 亿美金，而国资和互联网大厂很可能率先进场。人们对这一转变的态度也颇有些矛盾。" 不融资 " 的 DeepSeek，更能成就一个特立独行的形象，坚持自己并名满天下，一直是最受欢迎的故事。但如果这个象征走向失败，就会让一切索然无味。出于对商业逻辑的信奉，多数观点仍对 DeepSeek 拿出股权 " 待价而沽 " 给予认可。

而在国产算力适配方面，争议显得更大，某种程度上期待也更大。

实际上，作为此次深度适配传言中的主角之一，寒武纪方面曾提示我们，早在去年 9 月 DeepSeek 发布 V3.2-Exp（实验版）发布时，公司就完成了 Day 0 适配。作为国产顶级模型和国产芯片，这种合作很正常也并不神秘。而在 12 月 V3.2 正式版发布时，华为昇腾、寒武纪、海光信息三家国产芯片厂商也都宣布在当天完成适配。

不过，在近期的相关讨论中，不少消息都将 V4 迟到的原因指向 " 去英伟达 CUDA" 而迁移到国产芯片生态上，进而，值不值得以及谁主导了相关决策，都引起了不同的看法。一位芯片从业者即认为，DeepSeek 更多是被交办了一项任务，而这项任务的复杂性和难度，超过了公司在这个阶段的能力和预期。

另一方面，从结果上来说，这次深度适配又不断刺激出庞大的期待。尤其是黄仁勋在 4 月中旬做客达瓦克什 · 帕特尔（Dwarkesh Patel）的播客节目时，将 DeepSeek 优先适配国产芯片视为美国的 " 重大损失 "，更让这次事先张扬的生态协作引发了更多遐想。

而对于商业化变现，人们从 DeepSeek 的招聘信息到 4 月网页版更新时的 " 快速模式 " 与 " 专家模式 " 分层，孜孜寻找着蛛丝马迹，但似乎都很难论证它如何坚持免费开源、专注 AGI 探索的同时，还能赚到市场的钱。实际上，DeepSeek 公开的商业化路径目前只有 API 调用，而且，在其他模型快速迭代的背景下，这一模式也越来因云服务商越来越多地免费部署而出现波动。

这些新的问题、新的讨论，就是 V4 发布前的氛围。

在 4 月 24 日这一天，DeepSeek 交出的技术答卷仍是完整的：100 万 Token 上下文，通过架构创新大幅提升长文本处理和记忆能力；Agent 得到凸显，V4-Pro 在 Agentic Coding 评测中获得高分；而且性价比仍大幅领先业内同行。

虽然性能的提升和 " 价格屠夫 " 的属性仍得到不少赞许，但这款史上最强开源模型，也在不少反馈中被冠以 " 失望 " 的评语。

我们在部分开发者社群看到的评价也不算积极，有开发者注意到其技术报告对比的仍是闭源巨头的上一代模型，认为 DeepSeek 将性能测评 " 说得很含蓄 "，实际上与 GPT 与 Claude 的差距变大了，甚至在国产模型中优势也不明显。还有开发者直言，其 "Pro 版本的发布太匆忙 "，推理过程变得十分漫长，简单问题也要吐几万 token 的思维链，逻辑和输出结果却显得怪异，不少不符合常识的内容，可能是后训练没做安全对齐。更多声音则认为，在多模态、Agent 越来越强，还不断冒出 " 新玩法 " 的当下，V4 显得有些平庸和无趣。

而且，关于备受期待的国产模型与国产芯片的深度适配，这次发布同样鲜少着墨，50 余页的技术报告仅提到华为一次。虽然更多的国产芯片宣布了 Day 0 适配，但至少目前还看不到对 CUDA 生态的真正冲击。

也有从业者提示，适配问题需等待进一步消息的披露。但考虑到性能和表现并不惊艳，后续更新的细节能激起多大浪花，还有待观察。值得注意的是，DeepSeek 在 V4 的 token 价格表后附言：受限于高端算力，目前 Pro 的服务吞吐十分有限，预计下半年昇腾 950 超节点批量上市后，Pro 的价格会大幅下调。这也成了未来一段时间颇值得期待的进展。

截图来自 DeepSeek 官微

或许是感受到了周身氛围的变化，DeepSeek 在 V4 发布文章的末尾写下了一段话：

" 不诱于誉，不恐于诽，率道而行，端然正己。"

并称公司将 " 始终秉持长期主义的原则理念，在尝试与思考中踏实前行，努力向实现 AGI 的目标不断靠近 "。

这场漫长的等待终于结束了。我们也能更清晰地看到，等待 DeepSeek 的人们，究竟在等待些什么。

是远不止一个版本的迭代，一次性能的提升，抑或一家公司再次证明自己的故事。人们在等待预期之外的技术和故事，这也是 AI 时代所独特赋予的：永远超乎想象。

V4 没有交出这份不存在标准答案的答卷，但它依然高举着 AGI 的旗帜。正如行业内曾流行一句话：假装 AGI 已经存在的人，才能先做出 AGI。

DeepSeek 会在未来再次成为时代颠覆者吗？或许，在多年后再回看这次等待，我们才更能了解其意义。

（作者｜胡珈萌，编辑｜杨林）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

等待 DeepSeek 的 145 天

宙世代

一起剪

相关阅读

DeepSeek首次基于华为芯片训练！美国当天就坐不住了：指控中国大模型“抄袭”

企业能把安全交给Agent么？

恒生科技指数涨超1%，半导体板块爆发

龙芯内核授权：俄罗斯自研CPU游戏实测！《巫师3》能到38FPS

放弃小模型，元戎启行用物理AI打另外一场仗

小米汽车2027年出海；字节跳动海外营收占比创新高

腾讯首款合家欢派对游戏 《元梦之星》鸿蒙版正式上架

四场关于尊严与活着的远征

2499元 超级直播神器！华为随行WiFi X开售：下行5.3Gbps

小米开源Xiaomi-Robotics-0后训练全流程！机器人秀神操作：丝滑连续收纳耳机

《GT赛车》系列制作人山内：雷军是现代中国的英雄豪杰之一

泡泡玛特首款家电！LABUBU冰箱上架：5999元 全球限量999台

俞敏洪致歉！四大主播离职，东方甄选遭大量会员排队退费；DeepSeek多位核心骨干离职去大厂；马斯克把方向盘删了！特斯拉Cybercab已投产

余承东回应享界S9麋鹿测试争议：称测试中轮胎被放气并松动

和讯信息吕妮蔓：周末三大消息，周一开盘市场早知道

最新评论

钛媒体

热门推荐

企业资讯

腾讯首款合家欢派对游戏《元梦之星》鸿蒙版正式上架

2499元超级直播神器！华为随行WiFi X开售：下行5.3Gbps

泡泡玛特首款家电！LABUBU冰箱上架：5999元全球限量999台