[礼物]【东方计算机】阿里Qwen3正式发布,模型迭代再上一个台阶 [庆祝]阿

丹萱谈生活文化 2025-04-29 10:10:11

[礼物]【东方计算机】阿里Qwen3正式发布,模型迭代再上一个台阶 [庆祝]阿里昨夜凌晨正式发布并开源最新的Qwen3系列模型,包含2个MOE和6个稠密模型,在模型性能、参数量、混合思考模式、推理能力、支持MCP以及多语种方面都进行了较大幅度升级。 [庆祝]性能登顶开源模型王座,与顶尖闭源模型相差不大 通过扩大预训练和强化学习的规模,Qwen3模型的性能进一步明显提升,其旗舰模型在代码、数学、通用能力等基准测试中,与o1、o3-mini、Grok-3、Gemini-2.5-pro等顶尖模型性能相当,将开源模型的性能提升到新高度。与此同时,模型还引入了“思考模式”和“非思考模式”,用户可自行控制思考程度,在性能与时间、成本方面拥有更大的自由度。 [庆祝]8款模型适配各类场景,部署成本进一步降低 Qwen3系列的稠密模型包含从0.6B到32B的版本,可以适用于从手机到服务器和云端的各类部署场景,小参数模型的性能有明显增强,如4B模型和上一代的32B模型性能大致相当;而MOE模型则分为235B(激活参与22B)和30B(激活参数3B)两种规格,满血版部署的成本仅为DS-R1的三分之一。 [庆祝] 兼容MCP协议更好支持Agent Qwen3模型还原生支持MCP协议,从而对Agent应用的开发提供了较好支撑。此外,下一步通义团队还将要优化模型架构和训练方法,以实现长周期推理和拓展模态范围等目标。而且,通义团队还提到,目前行业正处于从专注模型训练过渡到训练Agent为中心的时代。 [庆祝]我们认为,Qwen3模型的发布,将国产模型能力提升到新的高度,基础模型的迭代仍保持较快速度,下一步还可以期待DeepSeek新模型的推出,以及Agent行业在模型能力持续提升,以及工具链逐步成熟下的加速发展。 [礼物]投资建议: [玫瑰]阿里Qwen3模型的亮眼表现,有望带来阿里软硬件生态伙伴和供应商的机会,包括算力领域的海南华铁、润建股份、数据港、海光信息、协创数据等,以及应用领域的税友股份、石基信息、卫宁健康等。 [玫瑰]此外,我们还建议关注寒武纪、合合信息、鼎捷数智、泛微网络、金山办公等公司。

0 阅读:13
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注