V4 “上桌”，DeepSeek 的故事更热血了

文 | 听筒 Tech（ID:tingtongtech），作者 | 杨林，编 | 饶霞飞

DeepSeek，这家被行业视为持有技术极客与执拗气质的公司，结束了它长达 15 个月的静默。

4 月 24 日，在 OpenAI 刚秀完肌肉、业内外都在猜测 " 中国军团 " 何时能跟上节奏时，DeepSeek 毫无征兆地甩出了 " 王炸 "，DeepSeek V4 上线。

在业内看来，V4 正在进行激进转身。它的登场，不仅带来了 1.6T 的稀疏大模型，更将手伸向了曾被视作禁区的高阶 Agent（智能体）。

而最让行业热血的是，DeepSeek V4 明确向外界传递，它与华为昇腾的联姻已进入深水区。无论是训练框架的迁移，还是下半年的算力支持，DeepSeek 都在告诉市场，在全球算力封锁的夹缝中，自己正在走一条中国式的自主闭环之路。

图：DeepSeek 公告发布 V4 预览版本

来源：DeepSeek 官方网站《听筒 Tech》截图

而就在 V4 发布之际，坊间关于 DeepSeek 以超 200 亿美元（此前为 100 亿美元）估值寻求融资的消息也传得沸沸扬扬，甚至还有市场信息将资本对象纷纷指向阿里和腾讯。

靴子仍未落地。但市场不难看出，DeepSeek 仍沿着技术苦行僧这条路继续攀登。V4 针对 Claude Code、OpenClaw 等主流 Agent 产品的专项优化，也反映了它在抢占开发者生态方面的迫切和焦虑。

毕竟，在 AI 讲通了上市和赚钱的故事后，比起参数更新，市场仍关心，梁文锋将带队走向何方。

当理想撞上现实，如何以极客的姿态继续 " 仰望星空 "，随着 V4 的落地，DeepSeek 需要讲给市场的是一个更热血，但更现实的商业故事。

-01-" 硬货 "V4，离商业化近了

在《听筒 Tech》看来，V4 的升级体现了 DeepSeek 一贯的风格，在前沿架构上足够激进。而在商业化落地上，这次，DeepSeek 显然迈出了一步。

技术的亮点，首先体现在体量的飞跃上。

目前来看，V4 分为两个版本，完整版参数量达到了惊人的 1.6 万亿，Lite 版也有 2850 亿。相比于上一代 V3（671B 参数），V4 的规模扩大了近 24 倍。

在当前行业普遍追求 " 小体量、专业模型 " 的背景下，DeepSeek 反而选择了一条更 " 重 " 的路，试图用暴力计算碾压出更复杂的智能。

图：V4 两个版本及参数量，来源：DeepSeek 官方公众号《听筒 Tech》截图

然后是架构的缝合与创新。

这一次，V4 引入了名为 DSA2 的注意力机制。这是一次技术集大成，它融合了 V3 中验证过的 DSA 设计，以及 2026 年初论文中提到的 NSA 稀疏注意力方案。

为了处理更长的上下文，V4 在 MoE（混合专家）架构上做了大幅调整，每层配置 384 个专家，推理时激活 6 个。这意味着，虽然模型总容量巨大，但在实际运行中，它依然保持了相对较高的效率。

市场还看到了 100 万 tokens 的上下文窗口。

这是一个非常实用的升级。最早，Kimi 就靠 " 长文本 " 出圈，而 100 万 tokens 的容量足以处理《三体》三部曲这样的长篇巨著。这对于法律合同分析、长篇小说创作、复杂代码库维护等企业级场景，是实实在在的生产力工具。

从模型角度整体来看，V4 没有去追所谓的 " 多模态 " 风口（目前明确是纯文本模型），而是继续死磕大参数和推理效率。实际上，这很符合 DeepSeek 的调性，不打概念战，只打参数和成本战。

不只是模型升级，V4 的战略重心，还明显转向了底层算力的国产化适配。

这是 V4 发布中最具行业影响力的信号，甚至，在市场看来，这远比模型本身的得分更为重要。

背景是这样的。在过去，中国大模型公司虽然做得风生水起，但底层算力依然重度依赖英伟达（NVIDIA）的 CUDA 生态。高端芯片进口受限后，国产 AI 芯片虽然算力纸面数据不差，但一直被 " 生态 " 卡脖子，很多模型在上面跑不起来，或者跑起来效率极低。

基于此，此次 V4 的发布，明确打出了 " 适配国产芯片 " 的旗号。

根据官方释放的信息，DeepSeek V4 团队投入了大量精力在与华为昇腾等国产 AI 芯片的底层适配工作上。这不是简单的 " 能用 "，而是追求 " 开箱即用 " 的深度工程化验证。

AI 从业者廖哥对《听筒 Tech》表示，" 这才是 V4 对国内 AI 产业真正的贡献，也是资本市场反应最激烈的地方。"

实际上，在 V4 预览版上线的当天，科创芯片设计 ETF 迅速拉涨。也即是说，市场看好的不仅仅是 DeepSeek 这家公司，而是对 " 模型 + 芯片 " 的闭环商业故事要走通的期待。

这也意味着，国产算力第一次有了一个世界级的软件生态撑腰，而一旦通道打通，正向的循环才可能形成。

"V4 在其中的角色，就是那个打破僵局的‘关键先生’。" 廖哥解释，" 模型适配国产卡，企业敢买国产卡，算力成本大幅下降，从而模型调用价格下降，最后促使应用爆发。"

-02- DeepSeek 或加速步调

不过，不可否认的是，在 V4 发布前，DeepSeek 确实处于一种微妙的境地。

一个事实是，它太 " 慢 " 了。从 R1 的爆火到 V4 发布，中间隔了 15 个月，而在这 15 个月里，竞争对手们，却跑得太快了。

字节的豆包在 2026 年初实现了技术的升级，Seedance 也在视频生成领域撕开了口子；智谱凭借 GLM-5.1 在编程能力上口碑反超；甚至连 DeepSeek 的核心团队都遭遇了挖角，R1 的核心贡献者之一郭达雅也被曝出 " 被挖了墙角 "。

在市场看来，DeepSeek 的 " 慢 "，答案是很明显的。

" 主要是技术洁癖。DeepSeek 不仅在做模型，还在花大量精力做底层代码的国产化适配（如 TileLang 语言），这在短期内拖慢了研发节奏。" 廖哥坦言，" 另外一个，是算力瓶颈。实际上，随着模型快速变大，仅靠幻方量化的自有资金，DeepSeek 已经捉襟见肘，很难有余粮去突破瓶颈。"

不过，随着 V4 的发布，这种 " 慢 " 可能转化为一种 " 快 "。

诸多的市场分析认为，V4 的发布，是 DeepSeek 从 " 纯理想主义 " 向 " 现实主义 " 过渡的转折。

一个最主要的表现是，号称 " 永不融资 " 的 DeepSeek，要开始市场融资了。

就在 V4 发布前夕，DeepSeek 被曝寻求至少 3 亿美元的外部融资。而此前，梁文锋曾多次拒绝包括腾讯、阿里在内的大厂注资。

不过，随着核心成员被高薪挖走，算力资金缺口加大，梁文锋开始接受现实。毕竟，稀释股权换取估值背书，是低成本稳定军心、留住人才最有效的路径。

" 我们仍相信，筹码加持下，梁文锋将带领 DeepSeek，开始新一轮启航。" 廖哥表示。

另一方面，从 V4 的发布节奏、产品策略和商业模式上，市场都看出了 DeepSeek 向应用靠拢的务实态度。

实际上，DeepSeek 在 V4 发布前，就已经上线了处理复杂推理的 " 专家模式 " 和快速响应的 " 快速模式 "，分别对应这次发布的 V4-Pro 和 V4-Flash 模型。

这也被业内解读为，DeepSeek 开始重视产品需求，从纯技术工厂转向产品逻辑。

另外，在 Agent 优先战略下，V4 明确针对 Claude Code 等主流 Agent 产品进行了优化，目标也换成了成为 "Agent 时代的基础设施 "。这等于说，它放弃自建生态，而服务于最能产生商业价值的应用层。

图：V4-Pro 在某 Agent 框架下生成的 PPT 内页示例，来源：DeepSeek 官方公众号《听筒 Tech》截图

尤为重要的是，据 OpenRouter 数据，V4-Flash 的 API 输出定价低至 2 元 / 百万 token，仅为 GPT-5.5 Pro 的约 1%。这种 " 价格屠夫 " 式的定价，目的在于快速获取市场份额，将技术优势转化为用户和收入，也是典型的公司商业化的早期打法。

" 以前的 DeepSeek 可以不融资、不站队，靠技术理想吸引人才。但现在，大模型的竞争已经是烧钱的基础设施战争。" 廖哥坦言。

" 毕竟，有了 V4 的技术实力，DeepSeek 能向资本要更高的价，如此才能买得起更多算力、留住人才，才能将国产化适配这件事做好。"

" 我们认为，经历多次跳票后，V4 ‘上桌’后，以后 DeepSeek 的路，可以走得更快。" 廖哥表示。

-03- 新的热血故事才刚开始

尽管 V4 参数升级以及大模型的国产适配化探索，带来了市场小震撼，但于 DeepSeek 而言，笑到最后仍是最根本的命题。

实际上，将 V4 与同行放在一起对比，优势是明显的。

比如，无论是与海外 OpenAI、Anthropic，还是国内的其他主流大模型，V4 的核心优势依然是主打 " 性价比 " 和 " 开源 "，并率先完成国产算力底座的适配。

用廖哥的话说，"V4 的目标不是一下子打死‘ GPT-5 们’，而是无限逼近，同时将成本打下来。事实上，DeepSeek 依然是条鲶鱼，它一旦开源，很多厂商的 API 就不好卖了。"

不过，DeepSeek 前方的路，也是布满荆棘的。

在技术上，V4 虽强，但并没能像当年的 R1 那样带来颠覆性的范式革新，更多的是工程和成本优化的集大成者。在 Agent 和复杂推理的极限测试中，DeepSeek 也承认与最顶尖的闭源模型存在几个月的差距。

而在生态上，虽然拉上了华为，但适配国产芯片的代价往往是牺牲开发的便捷性。如何让全球开发者心甘情愿地在一个非 CUDA 主导的生态里玩耍，这是 DeepSeek 和昇腾，都需要共同面临的长期课题。

但无论如何，DeepSeek 还是那个 DeepSeek。正如它在推文结尾引用的《荀子非十二子》的那句 " 不诱于誉，不恐于诽 "，说明这家公司依然带着一种极客特有的执拗。

在国产大模型普遍陷入应用变现焦虑的 2026 年，DeepSeek 希望死磕底层架构、推理成本和国产适配能力。

来源：DeepSeek 官方公众号《听筒 Tech》截图

这也让市场接下来的看点更明确了，既然 V4 证明了 " 我能行 "，那该 " 怎样行 " 以及 " 如何行 "，仍需要依赖后续的融资落地与商业推进。

这也是决定 DeepSeek 从技术极客进化为商业巨头的关键。毕竟，在这个时代，只有活下去的理想主义，才是真正的理想主义。

V4 开了一个好头，但真的热血故事，才刚开始。

（文中均为化名。）

（头图来自 AI 生成。）

（声明：本文仅作为信息交流，不构成任何投资参考建议。）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

V4 “上桌”，DeepSeek 的故事更热血了

宙世代

一起剪

相关阅读

看了腾讯的Hy3 preview，我读懂了姚顺雨

不只DeepSeek，大厂都想“抛弃”英伟达

年轻人第一台航拍机！大疆DJI Lito X1无人机图赏

假冒DeepSeek！全国首例AI混淆案宣判：罚款5000元

上架秒光！华为万元旗舰Pura X Max全色售罄

侧键侧滚轮不稀奇：乌龟海岸新鼠标直接上了2.25寸触控屏！要价1100元

3DMark macOS独立版终于发布：不用苹果商店、离线也能跑

腾讯大模型重回牌桌了吗？

DeepSeek V4、GPT5.5会师：通向AGI的门票只有Coding？

超频屠榜！华擎X870E OCF+9950X3D2横扫全球超频纪录

广东首次召开人工智能应用对接大会，将于4月27日在深亮相

源于中国，进击全球：安波福发布“中国定义”战略及多款智能终端解决方案

舱联破界、AI随行、雷达全感：移远通信“硬核三件套”引爆北京车展

2026北京车展明确参展企业十大负面行为清单

联想车计算发布基于NVIDIA DRIVE Thor的舱驾智算平台Auto AI Box

最新评论

钛媒体

热门推荐

企业资讯