关于ZAKER Skills 合作
钛媒体 2小时前

科学家们“造”了个新宇宙,却意外暴露了 AI 时代真正的瓶颈

距离 " 千衍 " 超大规模宇宙学模拟项目完成已过去一个月,但关于它的讨论仍在发酵。

核心观点围绕一个技术命题展开:在高性能计算与 AI 领域,存储正从配角变为决定系统性能的瓶颈与关键支点。

此前," 千衍 " 项目已于今年 4 月正式发布,简单一点来说,是科学家们一个用超级计算机模拟宇宙演化的科研项目。它追踪了 4.2 万亿个暗物质粒子,在 120 亿光年的空间尺度上,重现了宇宙百亿年的变化过程,帮助科学家研究暗物质和暗能量。

对此,我们与项目负责人王乔研究员,以及中科曙光高级副总裁李斌进行深入的交流。他们的回答指向同一个方向:存算一体不再只是理论设想,而是当前算力突围必须面对的现实课题。

存储已经跟不上计算的强大了?

在 " 千衍 " 项目中,团队完成了一次计算实验:生成 13PB 数据,模拟 120 亿光年宇宙尺度下 4.2 万亿暗物质质点的百亿年演化。

项目负责人王乔回忆,团队最初尝试用国际成熟软件在超算上运行,但测试两年始终跑不起来。因为支撑项目的不仅是极致的算力,更需要与之匹配的高性能存储系统,来承载模拟过程中产生的海量数据。

王乔作为从 0 到 1 看着 " 千衍 " 项目一步步走到如今的研究人员,分享了 " 千衍 " 项目一路走来的历程,他表示,起初,他们尝试使用国际上成熟的软件在大规模超算上运行," 第一次我们一开始就是这么想的,找个成熟的软件拿过来放心。但是后来发现,也差不多测试了两年,发现根本就跑不起来,整个这个事情就走不下去了。" 王乔回忆道,从其他超算切换到曙光的架构,这背后是无数次排查、调试和重写代码的深夜。

为什么其他超算最终未能承载 " 千衍 "?关键不在于算力规模,而在于架构匹配。项目前期使用的超算采用的是主从核架构,其核心优势在于规模庞大、算力强劲,但致命的短板的是内存偏小——这与 " 千衍 " 项目的需求形成了尖锐的矛盾。" 我们的模拟需要同时处理海量演化数据,这些数据首先要能‘装得下’,才能‘算得动’。" 王乔指出,而曙光的大内存架构恰恰契合了天文模拟的需求。最终," 千衍 " 在中科院网络中心的东方超算上使用了上亿 CPU 核时与千万加速卡时,完成了模拟计算。

透过 " 千衍 " 项目的经历,可以窥见当前高性能计算的一个技术趋势:在今天的 AI 和科学计算中,性能的瓶颈正在从计算单元本身,向存储和数据搬运环节迁移。这个转变不是渐进的,而是结构性的。王乔的团队遇到的直接障碍是——当 GPU 和 CPU 的计算能力持续飙升时,数据的读写和传输却卡住了整个链条的运转。" 在存储这一块、数据这一块是一个非常重要的事儿,之前大家关注得并没有那么多," 王乔坦言," 但它必须是在一个高速存储上面,否则就处理不完了,我们实际上需要一个非常快的处理方式才能解决。"

而这只是行业的一个缩影,当前无论是高性能计算领域,还是智算领域,都普遍存在一个困境,那就是 " 计算核心越来越强大,但数据搬不动了 "。美国德克萨斯大学奥斯汀分校教授 Mike Boylan-Kolchin 将 " 千衍 " 称为一项 " 计算奇迹 ",德国马普天体物理研究所所长 Volker Springel 则认为它 " 刷新了当前数值宇宙学的发展极限 "。在这些赞誉背后,真正支撑起这一奇迹的,恰恰是一套能够将存储性能推到极限的高端全闪存储系统。

存力为何可能成为终极制高点?

天文领域的极端案例并非孤例。当 2025 年中国分布式存储市场规模首次超越集中式存储达到 198.2 亿元,同比增长 43.7% 时,全闪存存储占比已提升至 24.1%,成为市场增长的核心引擎。而全球超算市场规模也将在 2026 年突破 186.7 亿美元,以 19.3% 的年增速扩张。这个高速增长的市场,正在催生一种全新的技术理念——存算一体不再只是实验室里的论文选题,而成为决定产业落地的核心命题。

在 AI 产业的另外一侧,同样的存算张力正以更激进的姿态上演。当大模型服务需要每日处理数百 TB 甚至 PB 级 KV 缓存数据时,数据搬动本身的能耗和延迟已经让传统架构捉襟见肘。郑纬民院士在吉林大学的讲座中明确指出,每个 token 对应的 KV-Cache 可达数十 KB,大规模服务中每日需处理数百 TB 甚至 PB 级缓存数据,对存储系统和传输速度提出极高要求。

在这种背景下," 以存储换计算 " 的思路开始进入主流视野:将 KV cache 从 GPU 显存卸载到存储介质,通过存储系统的性能换取计算效率的提升。这与 " 千衍 " 项目中王乔团队对存储性能的极致追求,实际上是同一个技术命题的两面——数据搬不动了,存储必须扛起来。

而这也是为什么近年来众多做存储的厂商都在布局 " 存算一体 " 的根本原因。存算一体的核心要义,在于打破计算与存储之间的壁垒,实现数据 " 就近计算、高效流转 ",从而解决传统高性能计算架构中 " 算力闲置、存储拥堵 " 的痛点。假如把算力比作 AI 时代的引擎,那么存力就是这颗引擎的燃油系统。引擎马力再强,如果燃油送不进去,一切都是徒劳。

对于 " 千衍 " 这样的超大规模科研项目而言,存算协同不仅是提升运算效率的关键,更是实现项目目标的前提。

与此同时,中科曙光高级副总裁李斌给出了一个耐人寻味的判断:" 现在人工智能来了之后,其实对存储系统本身提出了很高的要求,但是另外一方面也是未来可能会重塑未来存储的一些发展技术方向。" 这句话的潜台词是:AI 对存储的改变不是锦上添花,而是釜底抽薪。

存储行业的价值跃升,在更宏观的产业层面有着更加直观的体现。2025 年第二季度起,全球存储芯片价格开启了罕见的超级周期。TrendForce 数据显示,2025 年第四季度 DRAM 合约价较去年同期已上涨逾 75%。进入 2026 年,涨价势头未见缓解—— 2026 年全球生产的 DRAM 中高达 70% 将被数据中心消耗,到 2028 年的产能已被预订完毕。支撑这场超级周期的,不仅仅是产能不足的传统逻辑,更是 AI 训练和推理对内存和存储的结构性需求。存储正在从一个以产能周期驱动的周期性行业,转变为一个由 AI 需求增长驱动的长期成长行业。

更深层次的变革来自于存储的 " 角色升级 "。在传统计算架构中,存储是被动的数据容器,CPU 告诉它 " 给我数据 ",它就把数据取出来递过去。但在 AI 驱动的计算范式中,存储正在从 " 容器 " 升级为 " 数据引擎 "。这意味着,在未来的 AI 推理架构中,存储将不仅仅是数据的保管者,更将是计算过程的积极参与者,需要其具备主动理解数据语义,主动优化数据布局,主动配合算力调度的能力。

这正是存算一体的本质。它不是在芯片层面将计算和存储合二为一,而是在系统架构层面,让两个环节从前端到后端实现深度协同。在千衍项目中,这种协同以另一种方式体现:计算系统负责模拟数万亿粒子的引力演化,存储系统则保障海量数据的高效写入与读取,两者之间的数据传输被优化到了极致。

高性能存储成必备品

" 千衍 " 项目的成功,不仅是一个科研项目的突破,更预示着高性能计算领域的发展进入了高性能存储时代。

高性能计算领域对存算一体的需求,已经从 " 基础协同 " 向 " 深度融合 " 升级。传统的存算协同,更多是实现存储与算力的硬件适配,而未来的存算一体,将实现软件与硬件的深度融合,存储系统不仅能够提供数据存储和读写服务,还能够承担部分计算任务,实现 " 存储即计算 "。" 千衍 " 项目的实践,已经为这种深度融合提供了很好的范例——曙光的存储系统通过支持 KV cache 远端卸载、原生 KV 语义等技术,承担了部分 AI 推理过程中的计算任务,减轻了 GPU 的显存压力,提升了整个系统的运算效率。

对此,李斌表示:"AI 时代的高性能计算,是一个算力、存力、网络高度紧耦合的系统。存算一体的核心,就是打破原有技术边界,实现有机协同。"

从趋势上看,国内存储行业需要主要有三个趋势:一是高性能化,随着科研场景的升级,存储系统的读写速度、容量上限将持续提升,以满足 PB 级、EB 级数据的存储与处理需求;二是智能化,存储系统将引入 AI 技术,实现数据的智能管理、智能调度和智能优化,提升系统的运行效率和可靠性;三是国产化,随着国产替代的不断推进,高性能存储的核心部件、软件系统将逐步实现自主可控,构建完整的国产生态。

" 千衍 " 下一步也契合这一方向。王乔介绍,丰富模拟的物理内容,并引入 AI 优化算法、挖掘数据将成为 " 千衍 " 未来的发展方向,"AI4S 是未来科研的重要方向 "。

如果说 " 千衍 " 是对存算极限的一次极端测试,那么 AI 产业对存力的渴求则是更广泛的压力测试。存储,正从算力竞赛的 " 后勤部门 " 升级为 " 战略前线 "。

(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨杨林)

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容