众力资讯网

大模型越聪明,越离不开高速存储。 很多人以为AI基础设施只拼GPU,其实这只说

大模型越聪明,越离不开高速存储。

很多人以为AI基础设施只拼GPU,其实这只说对了一半。

训练阶段大家看算力,到了推理阶段,系统瓶颈会变得更复杂。尤其是大模型上下文窗口越来越长,动不动几十万、上百万token,KV Cache对显存和存储的压力会迅速放大。简单说,模型要记住更多上下文,就需要更快、更稳的数据读写能力。

这时候,高端集中式全闪存储的价值就出来了。

过去大家觉得集中式存储“老”,但AI推理和智能体场景反而需要它的低延迟、高可靠和强一致性。自动驾驶、运营商智能体、金融风控、医疗影像,这些场景不只是要存得多,更要调得快、响应稳。

中科曙光FlashNexus9000切的就是这个位置。相关报道提到,它通过超级隧道技术把单阵列性能提升到400万IOPS,同时强调快照、远程复制、容灾、多控多盘故障保护等能力。换句话说,它不是只追求“快”,而是在追求核心系统真正敢用的“稳快”。

我觉得这也是曙光存储值得关注的地方。AI时代的数据底座,不会只有一种形态。分布式适合大容量扩展,集中式适合核心热数据和低延迟场景。谁能把这两类能力放进整体算力方案里,谁就更接近下一代AI基础设施的主入口。