众力资讯网

北大和DeepSeek刚开源的DSpark框架，把大模型推理吞吐量直接拉高4倍，

2026-06-27 19:01:16 小茜Daisy 科技

北大和DeepSeek刚开源的DSpark框架，把大模型推理吞吐量直接拉高4倍，单用户生成提速最高85%。他们用轻量草稿模型先批量猜词，再让主模型一次性校验，这种半自回归架构切中了生产环境的算力浪费痛点。更关键的是采用MIT协议全开源，兼容主流模型。加上之前ACL获奖的NSA稀疏注意力，国产大模型终于开始拼底层效率，而不是盲目堆参数了。这才是行业真正需要的突破。

阅读：0 点赞：0

北大和DeepSeek刚开源的DSpark框架，把大模型推理吞吐量直接拉高4倍，

热门分类