小米官宣MiMo-V2.5 系列 API 永久降价，最高降幅达99%，不区分输入

小米官宣MiMo-V2.5 系列 API 永久降价，最高降幅达99%，不区分输入长度；Token Plan 计价体系优化，加量不加价，用量提升至原5-8倍；百万亿 Token 创造者激励计划圆满收官。

·MiMo-V2.5 系列 API 永久降价。相比原始 API 定价，新定价最高降幅可达 99%，且不再区分上下文窗口长度。

·Token Plan 计费体系优化，新版 Token Plan 计费体系定价不变，Credits 大幅提升，加量不加价，用量提升至原 5-8 倍。

·现有 Token Plan 用户额度全量重置。无论当前套餐用量如何，所有已订阅 Token Plan 且当前仍在有效期的用户（包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户，涵盖 Apache 软件基金会专属福利用户）的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置，并按新计费规则执行。

小米表示，本次价格调整背后，离不开小米技术团队在推理系统上的持续优化。

小米基于 SGLang HiCache 完整支持 SWA（Sliding Window Attention），将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7，并将可缓存 token 数量提升至优化前的近 5 倍，显著提升了缓存命中率和推理效率。同时，小米还通过优化专家并行方案、输入长度分桶策略等，进一步提升了集群输入吞吐能力，从而在保障服务质量的前提下持续降低单位 token 服务成本。

依靠技术的持续创新，小米希望通过提供兼具低成本与顶尖能力的模型服务，撬动真实、持续、规模化的推理需求，推动完整 AI基础设施链条的建设。让更多的人能用到更好的模型——这是 MiMo 不变的使命。

众力资讯网

小米官宣MiMo-V2.5 系列 API 永久降价，最高降幅达99%，不区分输入

热门分类