停更近五个月，这次梁文锋携 DeepSeek V4 绝地反击？黄仁勋都觉得“可怕”

本文来源：时代财经作者：庞宇林心林

图源：AI 生图

蛰伏近 5 个月，DeepSeek 终于迎来新一轮重磅迭代。

4 月 24 日，DeepSeek-V4 Preview 正式上线并开源，该版本分为 Pro 和 Flash 两款，分别对应官方网页端、App 界面的专家模式与快速模式。

从技术迭代方向来看，DeepSeek-V4 在模型参数体量与实际能力上实现不小突破。

DeepSeek 官方测评显示，V4-Pro 在 Agentic Coding、世界知识、数学、STEM 和竞赛级代码等测评中，达到当前开源模型领先水平，并在部分指标上比肩顶尖闭源模型。

此次备受关注的 V4 版本发布，较市场此前预期的 " 春节前后 " 节点晚了数月。而在这段时间里，大模型行业竞争空前激烈，部分大模型甚至以 " 月更 " 为节奏高频持续上新，DeepSeek 却一直悄无声息。

这家凭借低成本、高性能和开源打出辨识度的明星大模型企业，则一边因新模型 " 停更 "" 跳票 " 身陷舆论讨论，一边又被卷入人才流动和融资传闻。

时代财经注意到，深度求索官方在 DeepSeek-V4 官宣文稿末尾，特意援引了《荀子 · 非十二子》的名句 " 不诱于誉，不恐于诽，率道而行，端然正己。" 这十六个字表述，似乎是其对近期外界种种声音作出的间接回应。

V4 姗姗来迟，在华为昇腾平台首发

" 从现在开始，1M 上下文将是 DeepSeek 所有官方服务的标配。" 深度求索方面介绍，DeepSeek-V4 模型按大小分为 DeepSeek-V4-Pro、DeepSeek-V4-Flash 两个版本，上下文长度均为 1M（一百万）。

长上下文能力已非大模型行业的新鲜事。过去一年，国内外头部模型厂商几乎都在持续拉长上下文窗口。V4 更受关注的，是其通过结构创新实现推理成本大幅降低。

DeepSeek 在官方文章中表示，V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeek Sparse Attention），既实现全球领先的长上下文能力，又相较于传统方法大幅降低了对计算和显存的需求。

而 V4 更大的亮点在于 Agent 能力的显著提高。

在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平。" 目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与其思考模式存在一定差距。"

在世界知识测评中，V4-Pro 大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。此外，在数学、STEM、竞赛型代码的测评中，V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的成绩。

不过，DeepSeek 也坦言，在推理能力上，V4-Pro-Max 与最先进的前沿模型仍存在 3 至 6 个月的差距。

图源：DeepSeek-V4 技术报告

时代财经注意到，DeepSeek-V4 在海内外全网更新后，迅速在海外开发者社区和技术圈引起热议。

不少网友对于 DeepSeek 此次更新给出积极反馈，有评价称其几乎是 " 这个领域里相当彻底的开源 "，开发者文档完善、价格 " 低得惊人 "，同时却具备接近前沿模型的能力；也有用户直言，模型质量与价格相比是一笔 " 疯狂划算的交易 "。

实际上，DeepSeek V4 的登场比市场预期晚了许多。

早在今年初，就有消息传出 DeepSeek-V4 将在春节前后发布，一时间业内讨论度升温。但之后，市场几番猜测又频频落空。直至 4 月 24 日正式亮相，较上一轮模型更新（DeepSeek-V3.2）已间隔近 5 个月。

值得注意的是，对于此前外界猜测的延迟发布与底层代码重写、适配国产芯片有关的传闻，本次 DeepSeek-V4 技术报告给出了侧面印证。

时代财经注意到，深度求索罕见地将华为昇腾和英伟达写进 DeepSeek-V4 技术报告：" 我们在英伟达 GPU 和华为昇腾 NPU 平台上验证了细粒度 EP（专家并行）方案。"

华为官方也发布信息称，DeepSeek-V4 在昇腾首发，昇腾超节点全系列产品支持 DeepSeek V4 系列模型。

这一算力适配的选择，或将引来全球科技行业的震动。长期以来，全球 AI 算力的技术体系与产业生态，基本围绕英伟达的技术路线构建，其 CUDA 生态不仅为模型开发提供了成熟的工具支撑，更已成为行业内通用的 AI 计算标准接口。

如今，DeepSeek-V4 选择在华为昇腾平台首发，无疑打破了这一长期固化的算力生态格局。近日，英伟达创始人黄仁勋在一场访谈中就提到："DeepSeek 绝非一个关紧要的进步，如果 DeepSeek 率先在华为上发布，那对美国来说将是一个可怕的结果。"

与此同时，这一生态成本未来或能够进一步降低。DeepSeek 表示，受限于高端算力，目前 Pro 的服务吞吐十分有限，预计下半年昇腾 950 超节点批量上市后，Pro 的价格会大幅下调。

目前，按 DeepSeek 官方价格折算，V4-Pro 每百万 tokens 输入是 1 元，输出是 12 元；V4-Flash 每百万 tokens 的输入和输出分别是 0.2 元和 2 元。

图源：DeepSeek-V4 技术报告

融资传闻升温，DeepSeek 走到十字路口

在 DeepSeek-V4" 姗姗来迟 " 的这段空窗期里，大模型行业的竞争格局已悄然剧变，火药味渐浓——这与当年 DeepSeek R1 横空出世时的环境已然不同。

今年 2 月，字节跳动、腾讯、阿里等多家科技巨头纷纷加大 AI 应用投入，它们旗下的豆包、元宝和千问等产品的月活跃用户（MAU）迎来爆发式增长，在 AI 原生 App 榜单中强势崛起，一度撼动 DeepSeek 占据的 " 江湖地位 "。几乎在同一时间，Kimi K2.5、GLM-5、MiniMax M2.5 等国产大模型也密集登场。

随着 4 月上旬 DeepSeek 创始人梁文锋在内部沟通中透露，新一代旗舰大模型将于当月下旬发布的消息传开，一场围绕大模型的卡位战加速打响。

戏剧性的是，就在 DeepSeek-V4 上线的前一天，互联网巨头上演了一场集体 " 伏击 "，4 月 23 日，小米 MiMo-V2.5 和腾讯混元 Hy3 preview 同日开启公测，而阿里则在更早前的 4 月 2 日便发布了 Qwen3.6-Plus。

外部强敌环伺之下，DeepSeek 的内部组织稳定性与服务保障能力正在经受考验。

一方面，核心技术人才的接连出走，引发市场对这家基座大模型公司研发能力的担忧。公开信息显示，自 2025 年下半年以来，DeepSeek 的研发团队出现明显人员流动，DeepSeek 第一代大语言模型核心作者王炳宣转投腾讯、V3 版本核心贡献者罗福莉入职小米。

甚至在 4 月中旬 V4 版本呼之唤出之时，据晚点报道，当年 R1 核心研究员郭达雅选择加入字节跳动 Seed 团队。

另一方面，随着用户规模的扩张，DeepSeek 服务稳定性问题也日益凸显。2026 年开年以来，DeepSeek 多次出现大规模服务中断，其中 3 月 29 日晚至次日上午的宕机波及网页端与 APP 端，持续时间长达约 12 小时。

进入 4 月，关于 DeepSeek 启动首次外部融资的消息持续发酵。

就在 DeepSeek-V4 上线前一周，证券时报等多家媒体报道称，DeepSeek 正与投资者洽谈首轮外部股权融资，计划以不低于 100 亿美元的估值，募集不少于 3 亿美元资金。随后又有报道称，腾讯、阿里正洽谈以超过 200 亿美元估值投资 DeepSeek，两家投资方预计共计投资 18 亿美元。不过上述消息均未得到 DeepSeek 及相关方的确认。

这场融资传闻之所以引发如此大的反响，核心在于它与 DeepSeek 此前留给外界的 " 技术纯粹派 " 印象形成强烈反差。

梁文锋曾在公开表态中表现出对融资的明确排斥。其在采访中曾表示，幻方作为出资人之一为其充足研发预算；更核心的顾虑在于外部投资者或干预公司决策，梁文锋称很多 VC 对做研究有顾虑，存在退出需求，希望尽快做出产品商业化，而这与 DeepSeek 优先做研究的思路并不完全匹配。

彼时，独立于融资叙事之外、专注于技术研究，正是 DeepSeek 最吸引人的故事之一。一定程度上，当年 R1 横空出世，正是凭借这份纯粹的技术追求，在众多模型中脱颖而出，成为 AI 行业的 " 黑马 "。

但如今，大模型竞争已告别单点突破的时代，进入算力、人才、生态、产品和商业化的综合战。仅依靠技术声望和内部资金，或许已难以覆盖下一阶段的综合竞争成本。

而引入外部资本，不仅能补充弹药，还意味着企业的估值将得到市场定价，员工手中的股权激励也将有更清晰的价值参照。这对于过去一年频频被卷入人才流动讨论的 DeepSeek 来说，或许也是稳定团队、留住核心研发人员的一种更为现实的方式。

实际上，在 DeepSeek 尚未迈出融资这一步时，昔日同为大模型独角兽的竞争对手们，早已在资本市场上加速奔跑。

今年 1 月，智谱（02513.HK）与 MiniMax（00100.HK）先后登陆港交所，截至 4 月 24 日，两者最新市值分别达到 4169 亿港元和 2439 亿港元。

月之暗面虽尚未启动上市，但据财联社 3 月份报道，其今年以来已完成三轮融资，估值在 3 个月内翻了 4 倍，最新一轮融资估值上升至 180 亿美元。

对于站在十字路口的 DeepSeek 而言，一边是愈发残酷的算力与人才军备竞赛，另一边是向其抛出橄榄枝的资本市场。一边是坚守技术理想的初心，一边是应对商业竞争的现实压力。

这家曾给中国 AI 行业带来巨大惊喜的公司，能否在技术理想与现实之间找到可持续的平衡，将决定它下一阶段的生存与发展走向。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

停更近五个月，这次梁文锋携 DeepSeek V4 绝地反击？黄仁勋都觉得“可怕”

宙世代

一起剪

相关阅读

3股将被*ST，下周一停牌！一周7家A股公司被证监会立案

507万人民币梭哈英特尔！曾被全网群嘲败家子 如今身家暴涨至1370万元

国债期货正式开门迎客！合格境外投资者获准入场 仅限套期保值

阿塞拜疆抛售30亿美元黄金，大摩大幅下调预期至5200美元

不得以“支付优惠”为名诱导借贷！重磅新规9月30日起正式施行

专访长安启源熊前刚：天猫首款甄选好车长安启源全新Q05

内存价格终于松口了！DDR5最高狂降22%：创下四个月新低

A股一周20大熊股出炉：最熊股跌39%，联翔股份收获4个跌停1个涨停

美股科技芯片集体飙升，闪迪年内涨超320%

美股科技芯片集体飙升，英特尔大涨23%，美国对伊朗实施金融制裁

DeepSeek-V4正式发布；纳指、标普500指数再创新高

新能源汽车迈入存量博弈新阶段

深夜暴涨！巨头股价“狂飙”

陆家嘴财经早餐2026年4月25日星期六

中东冲突影响扩散！又一重要原料，价格飙涨

最新评论

时代财经

热门推荐

企业资讯

507万人民币梭哈英特尔！曾被全网群嘲败家子如今身家暴涨至1370万元

国债期货正式开门迎客！合格境外投资者获准入场仅限套期保值