本文来源:时代财经 作者:庞宇 林心林

蛰伏近 5 个月,DeepSeek 终于迎来新一轮重磅迭代。
4 月 24 日,DeepSeek-V4 Preview 正式上线并开源,该版本分为 Pro 和 Flash 两款,分别对应官方网页端、App 界面的专家模式与快速模式。
从技术迭代方向来看,DeepSeek-V4 在模型参数体量与实际能力上实现不小突破。
DeepSeek 官方测评显示,V4-Pro 在 Agentic Coding、世界知识、数学、STEM 和竞赛级代码等测评中,达到当前开源模型领先水平,并在部分指标上比肩顶尖闭源模型。
此次备受关注的 V4 版本发布,较市场此前预期的 " 春节前后 " 节点晚了数月。而在这段时间里,大模型行业竞争空前激烈,部分大模型甚至以 " 月更 " 为节奏高频持续上新,DeepSeek 却一直悄无声息。
这家凭借低成本、高性能和开源打出辨识度的明星大模型企业,则一边因新模型 " 停更 "" 跳票 " 身陷舆论讨论,一边又被卷入人才流动和融资传闻。
时代财经注意到,深度求索官方在 DeepSeek-V4 官宣文稿末尾,特意援引了《荀子 · 非十二子》的名句 " 不诱于誉,不恐于诽,率道而行,端然正己。" 这十六个字表述,似乎是其对近期外界种种声音作出的间接回应。
V4 姗姗来迟,在华为昇腾平台首发
" 从现在开始,1M 上下文将是 DeepSeek 所有官方服务的标配。" 深度求索方面介绍,DeepSeek-V4 模型按大小分为 DeepSeek-V4-Pro、DeepSeek-V4-Flash 两个版本,上下文长度均为 1M(一百万)。
长上下文能力已非大模型行业的新鲜事。过去一年,国内外头部模型厂商几乎都在持续拉长上下文窗口。V4 更受关注的,是其通过结构创新实现推理成本大幅降低。
DeepSeek 在官方文章中表示,V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),既实现全球领先的长上下文能力,又相较于传统方法大幅降低了对计算和显存的需求。
而 V4 更大的亮点在于 Agent 能力的显著提高。
在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平。" 目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与其思考模式存在一定差距。"
在世界知识测评中,V4-Pro 大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。此外,在数学、STEM、竞赛型代码的测评中,V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的成绩。
不过,DeepSeek 也坦言,在推理能力上,V4-Pro-Max 与最先进的前沿模型仍存在 3 至 6 个月的差距。

时代财经注意到,DeepSeek-V4 在海内外全网更新后,迅速在海外开发者社区和技术圈引起热议。
不少网友对于 DeepSeek 此次更新给出积极反馈,有评价称其几乎是 " 这个领域里相当彻底的开源 ",开发者文档完善、价格 " 低得惊人 ",同时却具备接近前沿模型的能力;也有用户直言,模型质量与价格相比是一笔 " 疯狂划算的交易 "。
实际上,DeepSeek V4 的登场比市场预期晚了许多。
早在今年初,就有消息传出 DeepSeek-V4 将在春节前后发布,一时间业内讨论度升温。但之后,市场几番猜测又频频落空。直至 4 月 24 日正式亮相,较上一轮模型更新(DeepSeek-V3.2)已间隔近 5 个月。
值得注意的是,对于此前外界猜测的延迟发布与底层代码重写、适配国产芯片有关的传闻,本次 DeepSeek-V4 技术报告给出了侧面印证。
时代财经注意到,深度求索罕见地将华为昇腾和英伟达写进 DeepSeek-V4 技术报告:" 我们在英伟达 GPU 和华为昇腾 NPU 平台上验证了细粒度 EP(专家并行)方案。"
华为官方也发布信息称,DeepSeek-V4 在昇腾首发,昇腾超节点全系列产品支持 DeepSeek V4 系列模型。
这一算力适配的选择,或将引来全球科技行业的震动。长期以来,全球 AI 算力的技术体系与产业生态,基本围绕英伟达的技术路线构建,其 CUDA 生态不仅为模型开发提供了成熟的工具支撑,更已成为行业内通用的 AI 计算标准接口。
如今,DeepSeek-V4 选择在华为昇腾平台首发,无疑打破了这一长期固化的算力生态格局。近日,英伟达创始人黄仁勋在一场访谈中就提到:"DeepSeek 绝非一个关紧要的进步,如果 DeepSeek 率先在华为上发布,那对美国来说将是一个可怕的结果。"
与此同时,这一生态成本未来或能够进一步降低。DeepSeek 表示,受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。
目前,按 DeepSeek 官方价格折算,V4-Pro 每百万 tokens 输入是 1 元,输出是 12 元;V4-Flash 每百万 tokens 的输入和输出分别是 0.2 元和 2 元。

融资传闻升温,DeepSeek 走到十字路口
在 DeepSeek-V4" 姗姗来迟 " 的这段空窗期里,大模型行业的竞争格局已悄然剧变,火药味渐浓——这与当年 DeepSeek R1 横空出世时的环境已然不同。
今年 2 月,字节跳动、腾讯、阿里等多家科技巨头纷纷加大 AI 应用投入,它们旗下的豆包、元宝和千问等产品的月活跃用户(MAU)迎来爆发式增长,在 AI 原生 App 榜单中强势崛起,一度撼动 DeepSeek 占据的 " 江湖地位 "。几乎在同一时间,Kimi K2.5、GLM-5、MiniMax M2.5 等国产大模型也密集登场。
随着 4 月上旬 DeepSeek 创始人梁文锋在内部沟通中透露,新一代旗舰大模型将于当月下旬发布的消息传开,一场围绕大模型的卡位战加速打响。
戏剧性的是,就在 DeepSeek-V4 上线的前一天,互联网巨头上演了一场集体 " 伏击 ",4 月 23 日,小米 MiMo-V2.5 和腾讯混元 Hy3 preview 同日开启公测,而阿里则在更早前的 4 月 2 日便发布了 Qwen3.6-Plus。
外部强敌环伺之下,DeepSeek 的内部组织稳定性与服务保障能力正在经受考验。
一方面,核心技术人才的接连出走,引发市场对这家基座大模型公司研发能力的担忧。公开信息显示,自 2025 年下半年以来,DeepSeek 的研发团队出现明显人员流动,DeepSeek 第一代大语言模型核心作者王炳宣转投腾讯、V3 版本核心贡献者罗福莉入职小米。
甚至在 4 月中旬 V4 版本呼之唤出之时,据晚点报道,当年 R1 核心研究员郭达雅选择加入字节跳动 Seed 团队。
另一方面,随着用户规模的扩张,DeepSeek 服务稳定性问题也日益凸显。2026 年开年以来,DeepSeek 多次出现大规模服务中断,其中 3 月 29 日晚至次日上午的宕机波及网页端与 APP 端,持续时间长达约 12 小时。
进入 4 月,关于 DeepSeek 启动首次外部融资的消息持续发酵。
就在 DeepSeek-V4 上线前一周,证券时报等多家媒体报道称,DeepSeek 正与投资者洽谈首轮外部股权融资,计划以不低于 100 亿美元的估值,募集不少于 3 亿美元资金。随后又有报道称,腾讯、阿里正洽谈以超过 200 亿美元估值投资 DeepSeek,两家投资方预计共计投资 18 亿美元。不过上述消息均未得到 DeepSeek 及相关方的确认。
这场融资传闻之所以引发如此大的反响,核心在于它与 DeepSeek 此前留给外界的 " 技术纯粹派 " 印象形成强烈反差。
梁文锋曾在公开表态中表现出对融资的明确排斥。其在采访中曾表示,幻方作为出资人之一为其充足研发预算;更核心的顾虑在于外部投资者或干预公司决策,梁文锋称很多 VC 对做研究有顾虑,存在退出需求,希望尽快做出产品商业化,而这与 DeepSeek 优先做研究的思路并不完全匹配。
彼时,独立于融资叙事之外、专注于技术研究,正是 DeepSeek 最吸引人的故事之一。一定程度上,当年 R1 横空出世,正是凭借这份纯粹的技术追求,在众多模型中脱颖而出,成为 AI 行业的 " 黑马 "。
但如今,大模型竞争已告别单点突破的时代,进入算力、人才、生态、产品和商业化的综合战。仅依靠技术声望和内部资金,或许已难以覆盖下一阶段的综合竞争成本。
而引入外部资本,不仅能补充弹药,还意味着企业的估值将得到市场定价,员工手中的股权激励也将有更清晰的价值参照。这对于过去一年频频被卷入人才流动讨论的 DeepSeek 来说,或许也是稳定团队、留住核心研发人员的一种更为现实的方式。
实际上,在 DeepSeek 尚未迈出融资这一步时,昔日同为大模型独角兽的竞争对手们,早已在资本市场上加速奔跑。
今年 1 月,智谱(02513.HK)与 MiniMax(00100.HK)先后登陆港交所,截至 4 月 24 日,两者最新市值分别达到 4169 亿港元和 2439 亿港元。
月之暗面虽尚未启动上市,但据财联社 3 月份报道,其今年以来已完成三轮融资,估值在 3 个月内翻了 4 倍,最新一轮融资估值上升至 180 亿美元。
对于站在十字路口的 DeepSeek 而言,一边是愈发残酷的算力与人才军备竞赛,另一边是向其抛出橄榄枝的资本市场。一边是坚守技术理想的初心,一边是应对商业竞争的现实压力。
这家曾给中国 AI 行业带来巨大惊喜的公司,能否在技术理想与现实之间找到可持续的平衡,将决定它下一阶段的生存与发展走向。