众力资讯网

小米官宣MiMo-V2.5 系列 API 永久降价,最高降幅达99%,不区分输入

小米官宣MiMo-V2.5 系列 API 永久降价,最高降幅达99%,不区分输入长度;Token Plan 计价体系优化,加量不加价,用量提升至原5-8倍;百万亿 Token 创造者激励计划圆满收官。

·MiMo-V2.5 系列 API 永久降价。相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。

·Token Plan 计费体系优化,新版 Token Plan 计费体系定价不变,Credits 大幅提升,加量不加价,用量提升至原 5-8 倍。

·现有 Token Plan 用户额度全量重置。无论当前套餐用量如何,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专属福利用户)的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并按新计费规则执行。

小米表示,本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。

小米基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。同时,小米还通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。

依靠技术的持续创新,小米希望通过提供兼具低成本与顶尖能力的模型服务,撬动真实、持续、规模化的推理需求,推动完整 AI基础设施链条的建设。让更多的人能用到更好的模型——这是 MiMo 不变的使命。