特大喜讯|中国AI核心研究今夜再次实现巨大突破!
北京时间6月25日凌晨,从德国汉堡传来一条重磅消息。在当地举办的第41届国际高性能计算大会上,全球最权威的存储性能榜单IO500正式揭晓,中科曙光自主研发的ParaStor F9000全闪存储系统直接拿下了生产型全节点和10节点两大核心榜单的双料冠军,同时把世界纪录直接刷新了一大截。
这条消息是科技日报率先报道的,真实性完全有保障。可能很多人对这个奖的分量没概念,我给大家掰开了说。
IO500在存储界的地位,就相当于奥运会的金牌榜,是全球公认最权威的性能评测榜单。但很多人不知道,这个榜单还分两种,一种叫研究型,一种叫生产型。研究型就是实验室里跑极限数据,可以关掉冗余、停掉后台,用最理想的状态跑理论峰值。而生产型榜单,门槛要高得多。
什么叫生产型?就是你提交的这套系统,必须是已经在真实业务环境里长期跑着的,不能临时搭个实验室样机来凑数。得满足真实业务负载、有完整的冗余设计,还得持续稳定运行,部署时间通常都是按年算的。简单说,一个是实验室里的跑分机器,一个是真刀真枪在一线干活的实战装备。
这次中科曙光拿的,就是两个生产型榜单的第一。而且是中国厂商第一次在这个评选里实现双榜第一。
具体数据有多夸张?这套系统的吞吐速度达到了每秒26888.39 GiB,差不多就是每秒能读写26TB的数据。元数据操作能力更是达到了每秒2.33亿次。最终总分79110.05,直接是第二名成绩的两倍还多。
这个差距是什么概念?就相当于百米赛跑,冠军冲线的时候,亚军才跑了一半。
可能有人会问,不就是个存储吗?跟AI有什么关系?关系太大了。现在大家都在聊大模型、聊算力,都盯着GPU卡数,但很多人忽略了一个核心瓶颈——存储。
训练大模型的时候,成千上万张GPU卡同时在跑,每一秒都需要海量数据喂进去。如果存储跟不上,GPU就算性能再强,也得等着数据,算力再高也发挥不出来。存储就相当于AI大模型的"粮草官",粮草运不上去,前线部队再能打也没用。
ParaStor F9000就是专门为AI训练场景打造的。它支持从千卡到十万卡级别的集群整机柜交付,能把千亿参数大模型的部署时间直接缩短一半,整个集群的训练效率能提升50%。说白了,原来训练一个大模型要半年,现在三个月就能搞定。
而且这不是实验室里的纸面数据。从今年2月国家超算互联网核心节点启动建设开始,这套系统就已经投入实际生产环境了。到现在为止,它已经在数万卡规模的集群里稳稳当当跑了一年多,给大模型训练、科学计算这些核心场景托底。
举个实际例子,这套系统联合龙讯旷腾的MatPL软件,在曙光自己的万卡超算集群上,完成了414.7亿原子规模的液态水分子动力学模拟计算,直接打破了这个领域的世界纪录。而且所有原子间的相互作用,都是第一性原理级别的精度。
这意味着什么?意味着我们不光是存储性能跑分得高,在真实的前沿科研场景里,一样能打。
更关键的是,这套系统从硬件到软件,全栈都是自主研发的。核心部件国产化,核心软件自己写,不存在卡脖子的问题。现在全球AI竞争这么激烈,供应链安全有多重要,不用我多说。
过去高端存储市场,基本都是海外巨头说了算。从2022年曙光第一次拿IO500的10节点冠军,把世界纪录提升了146%,到这次直接包揽两个生产型榜单第一,把第二名远远甩在身后,其实就是中国存储技术从跟跑到领跑的一个缩影。
很多人聊AI竞争,只盯着大模型本身,只看参数多少、能力多强。但真正的竞争,是底层基础设施的竞争。算力、存储、网络,哪一块有短板,整个AI产业都跑不快。
这次曙光拿的这个双第一,表面上看是存储性能的胜利,实际上是中国AI基础设施能力的一次集中体现。我们不光能做大模型应用,底层的核心硬件和软件,一样能站到世界最前列。
而且最难得的是,这不是靠堆料堆出来的实验室产品,是已经在生产环境里验证过的成熟方案。这意味着接下来国内的大模型厂商、科研机构,都能用上全球顶级的存储能力,整个行业的研发速度都会提上来。
德国汉堡的榜单揭晓的时候,现场很多海外厂商的表情都挺复杂的。毕竟过去这个位置,一直都是他们的。但现在,中国公司凭实力坐上去了。
这条消息可能没有某个新发布的大模型那么吸引眼球,但对于整个中国AI产业来说,这才是真正的底气所在。底层技术扎实了,上面的应用才能百花齐放。这次的突破,只是一个开始。
