众力资讯网

【罗福莉谈MiMoAPI降价】小米 MiMo 官方昨日宣布,小米 MiMo-V2

【罗福莉谈MiMoAPI降价】小米 MiMo 官方昨日宣布,小米 MiMo-V2.5 系列 API 永久降价,相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。小米 MiMo 负责人罗福莉随后发文,谈到了 MiMo API 降价的技术原因。她表示,MiMo API 价格下调的背后:最高降幅可达 99%,针对的是输入(缓存命中)。核心原因在于我们的推理框架现在支持针对 SWA 的分层 KV 缓存优化。生产推理引擎测试表明,该优化将缓存的 Token 容量提升了 5 倍,相当于降低了 80% 的缓存成本。再结合 Hybrid 模型中多个 Full Attention 模块之间的缓存读取重叠(Cache Read Overlap),实际成本得到了进一步降低。 小米罗福莉谈 MiMo API 降价