Qwen3-Next-80B-A3B已发布 80亿参数,但每个令牌仅激活30

JavaEdge聊AIss 2025-09-13 15:33:38

Qwen3-Next-80B-A3B 已发布 80亿参数,但每个令牌仅激活30亿 → 训练成本降低10倍,推理速度比Qwen3-32B快10倍。(尤其在32K+上下文时!) Qwen3-Next-80B-A3B-Instruct 接近我们的235亿旗舰模型。 Qwen3-Next-80B-A3B-Thinking 超越 Gemini-2.5-Flash-Thinking 两者现已在 anycoder 中可用,适合氛围编码

0 阅读:1
JavaEdge聊AIss

JavaEdge聊AIss

感谢大家的关注