Qwen3来了!模型特色:思考更深,速度更快-Qwen3是全球最强开源模

茶茶来看科技 2025-04-29 19:05:31

Qwen3 来了!

模型特色:思考更深,速度更快

- Qwen3 是全球最强开源模型,性能全面超越 DeepSeek R1,国内第一个敢说全面超越 R1 的模型,之前都是比肩

- Qwen3 是国内首个混合推理模型,复杂答案深度思考,简单答案直接秒回,自动切换,提升智力+节省算力双向奔赴

- 模型部署要求大幅降低,旗舰模型仅需4张H20就能本地部署,部署成本估算下来是能比R1下降超6成

- Agent 能力大幅提升,原生支持 MCP 协议,提升了代码能力,国内的 Agent 工具都在等它

- 支持119种语言和方言,包括爪哇语、海地语等地方性语言,全世界都可以用上 AI

- 训练数据 36 万亿 token,相比 Qwen2.5 直接翻倍,不仅从网络抓取内容,还大量提取 PDF 的内容、大量合成代码片段

- 模型部署要求大幅降低,旗舰模型仅需4张H20就能本地部署,是 R1 的三分之一

模型性能:

旗舰版 Qwen3 的数学、代码的各项指标超强。

全面超越 OpenAI o1 和 o3 mini、 DeepSeek R1、Grok3。

模型家族:

Qwen3 总共开源 8 款模型,包括 2 款 MoE 模型和 6 款 Dense 模型。

2 款 MoE 模型:

旗舰版 Qwen3-235B-A22B,激活参数仅22B,部署成本为 DeepSeek R1 的三分之一。

迷你版 Qwen3-30B-A3B,激活参数仅3B,整体性能堪比 Qwen2.5-32B,适合消费级显卡部署。

6 款 Dense 模型:0.6B、1.7B、4B、8B、14B、32B

0.6B的,可在手机等端侧部署。

0 阅读:56
茶茶来看科技

茶茶来看科技

感谢大家的关注