众力资讯网

开放计算路线抢跑!scaleX万卡超集群筑基中部算力高地

从真机展示到实体落地,开放计算路线抢跑节奏依旧。2月5日,刚刚问世两个月的scaleX万卡超集群,迅速迎来规模化验证期—

从真机展示到实体落地,开放计算路线抢跑节奏依旧。

2月5日,刚刚问世两个月的scaleX万卡超集群,迅速迎来规模化验证期——国家超算互联网郑州核心节点正式进入试运行阶段,并且同步部署了3套中科曙光scaleX万卡超集群系统,这也标志着我国超大规模智算基础设施的建设与运营能力,正式迈入世界前列。

据悉,此次郑州核心节点是国家部委牵头打造的战略级算力枢纽,未来不仅要成为中部地区的算力高地,还要承接西部的绿色算力资源,满足东部地区的算力需求外溢。

如此关键的中国算网腹地,把计算底座直接交给了刚刚出道的scaleX万卡超集群。为什么?

01 开放架构是主因

这两年,随着大模型参数量暴涨,全球数据中心产能高峰大幅提前。但由于计算基础设施的技术路线差异,导致算力流通阻塞、机房闲置率跟涨,甚至一度出现阶段性算力过剩现象。

算力真的过剩吗?根据业内调研观点,这一现象本质上是一种结构性错配,因为部分算力资源并不具备复用价值,异构迁移过去的用户往往计算效率骤降,这就造成了国产算力结构失衡,比如“低端过剩、高端短缺”、“西部过剩、东部短缺”的尴尬格局。

scaleX万卡超集群的一个关键特征就是异构兼容能力。由于其本身采用AI计算开放架构,可以适配支持各类AI加速卡,广泛兼容主流AI软件生态,不仅起到了很好的算力资源承接转化作用,还能支持AI模型、业务应用快速无缝迁移与深度优化。

这无论是对于用户还是算力供给侧厂商,都是一种共赢方案。尤其国家超算互联网核心节点的特殊定位,也决定了其本身必须具备开放属性,scaleX万卡超集群自然成为首选。

02 性能实力有底气

作为全球首个基于开放架构打造的万卡超集群,scaleX业界领先的性能实力同样不容忽视。

比如在算力密度方面,scaleX万卡超集群通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署。尤其是它的高密度单机柜,基于超高密度刀片、浸没相变液冷等技术,单机柜算力密度可达同类产品的20倍。

另外,大规模计算集群的通信性能也是重要指标。数据显示,scaleX在集群通信中采用了自主研发原生RDMA高速网络,基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟。

这在业内绝对属于领先水平,超集群规模可以轻松扩展至10万卡以上,相比传统IB网络提升了大约2.33倍,同时网络总体成本还能降低30%。

据悉,scaleX还实现了从芯片级、系统级到应用级的三级数据传输协同优化,可以高效应对大模型训练时万卡并发读写带宽极致需求挑战,高通量AI推理时的响应速度与结果精准度也得到大幅提升,AI加速卡资源利用率进一步提高55%,放大到万卡级集群效益更加突出。

03 产业生态有前景

当性能足够好、架构足够开放时,计算集群的产业生态价值也开始充分显现。

比如,基于开放的架构标准体系,计算产业链上下游企业、科研机构都能参与应用创新和技术联合攻关,有效降低个体研发成本和门槛,并共享生态体系创新成果。这不仅加快了整体技术迭代节奏,也从根本上摆脱了多路线“重复造轮子”,产业创新活力更加充沛。

据了解,scaleX万卡超集群刚刚发布两个多月,就在郑州核心节点上线时吸引了不少拥趸。比如头部大模型企业、BAT、AI科技公司均与其建立合作。

并且,郑州节点也宣布了后续计划,据说要围绕节点打造集交易撮合、供需对接、生态创新、产业孵化于一身的综合服务体。这就是典型的生态价值外溢了。

总的来说,抛开万卡超集群的性能领先优势,开放计算路线能够持续抢跑,主要在于自身底子扎实的同时,还兼顾了多方利益。尤其作为一种平台枢纽角色,对于“全国一体化算力网”顶层设计的响应,就足以让其立于不败之地。

声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。