会不会经常用大模型 API的时候,它一个字一个字慢慢蹦出来了这次 DeepSeek 和北大联合发布 DSpark,本质上就是在解决这个问题。
先让一个“小模型”快速打草稿,猜后面几个 token,再让大模型一次性验证。猜对了就直接用,猜错了再修正,它提升的就是推理效率。DeepSeek新发布的DSpark有多强
官方数据显示,DSpark 已经部署在 DeepSeek V4 Flash 和 V4 Pro 的真实线上服务里,相同吞吐下,V4-Flash 单用户生成速度最高提升 85%,V4-Pro 最高提升 78%。
模型能力决定用户愿不愿意用第一次,生成速度和调用成本,决定用户会不会一直用。所以 DSpark 这类推理加速框架,可能才是AI产品真正大规模落地的关键基础设施。





