关于ZAKER Skills 合作
格隆汇 5小时前

DeepSeek 重磅发布,华为昇腾加持!国产芯片起飞

国产大模型领域再添新突破。

4 月 24 日上午,深度求索(DeepSeek)正式发布全新系列大模型 DeepSeek-V4 预览版,同步完成开源,并开放官网、App 及 API 调用服务,标志着百万字超长上下文能力进入普惠阶段,为国内开源领域及大模型产业发展注入新动力。

受此消息提振,半导体、国产芯片概念直线拉升,富瀚微 20cm 涨停,杰华特涨超 16%,优迅股份涨超 15%,华虹公司涨超 12%,海光信息大涨超 8%。

此外,DeepSeek 概念股明显异动,皖通科技由跌转涨,直线封板。

DeepSeek V4 炸场:

万亿参数 + 百万上下文 + 华为芯片

根据 DeepSeek 的官方介绍,V4 系列包含两个 MoE 模型:

DeepSeek-V4-Pro 总参数 1.6T、激活参数 49B;

DeepSeek-V4-Flash 总参数 284B、激活参数 13B。

两款模型均原生支持100 万 token 上下文

在 1M 上下文设置下,V4-Pro 的单 token 推理 FLOPs 只有 V3.2 的 27%,KV Cache 只有 10%;V4-Flash 更极端,分别压到 10% 和 7%。

另外值得注意的是,V4 最关键的突破,不在参数规模,而在算力底座。

V4 技术报告第 3.1 节专门写了一句:" 我们在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度 EP(专家并行)方案。" 这是 DeepSeek 官方第一次在正式文档中把华为昇腾和英伟达并列写进硬件验证清单。

实测数据:在昇腾 950PR 上,V4 单卡推理性能达到英伟达特供版 H20 的 2.87 倍。推理速度较初期适配版本提升 35 倍。多模态生成效率提升 60%。成本仅为 GPT 同等服务的十分之一。

更关键的是:CANN 框架已实现超 95% 的 CUDA 代码兼容,配合一键迁移工具,代码重构从 " 按月计 " 缩短到 " 按小时计 "。

这是第一次,万亿级模型在主流生态之外完成完整闭环。国产芯片 + 国产模型 + 国产框架,真正实现了算力自主、模型自主、生态自主。

DeepSeek 在官宣文章中还表示:" 预计下半年昇腾 950 超节点批量上市并部署之后,Pro 版本的价格也会大幅度下调。

国际市场调研机构 IDC 2026 年 4 月数据显示,华为昇腾 2025 年在国产 AI 芯片中,出货量是最大的。市场普遍预计,昇腾 950 系列 2026 年也将成为中国市场出货量最大的国产 AI 芯片。

山西证券指出,DeepSeekV4 等国产大模型有望原生适配国产算力,供需两旺下,国产芯片对国产通信芯片解决方案的需求更为迫切。

估值翻倍

据多家媒体报道,DeepSeek 近日启动首轮融资,正与少数战略投资者接触,目标估值已从此前至少 100 亿美元推高至 200 亿美元(约合人民币 1365 亿元)。

坊间关于 DeepSeek 融资前的估值数字一直在变化,甚至还传出腾讯、阿里争抢入局的消息。

一位接近 DeepSeek 的一线机构投资人士表示,这些数字都不准确,DeepSeek 融前估值是 3000 亿人民币,约合 440 亿美元。

不过相比美国大模型巨头 OpenAI、Anthropic,仍不在一个量级。OpenAI 今年 4 月最新完成的募资规模 1220 亿美元,Anthropic 于 2 月完成 G 轮融资规模是 200 亿美元。

从 " 从不融资 " 到 " 对外融资 ",DeepSeek 的这一步,某种程度上也是对现实的选择——大模型的竞争,终究是一场涉及巨额资本、算力资源和顶级人才的全方位较量。

附:DeepSeek 产业链概念股梳理

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容