全新开源通义千问Qwen3模型系列特性与能力详解-开发者社区-阿里云

全新开源通义千问Qwen3，它来了！

2025-05-07 12107

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Qwen3是通义千问系列的最新模型，融合推理与非推理模式，兼具QwQ和Instruct模型能力。提供多种尺寸，包括235B-A22B、30B-A3B及六个Dense模型，大幅提升数学、代码、逻辑推理和对话能力，达到业界领先水平。旗舰模型Qwen3-235B-A22B在多场景测试中表现优异，小型模型如Qwen3-4B性能媲美大模型。用户可在阿里云百炼平台免费体验各100万Token。

Qwen3有效融合推理模式和非推理模式，一个模型同时兼具之前QwQ模型（推理模式，用于数学、代码、逻辑推理等场景）和instruct模型（非推理模式，通用对话等场景）的回复能力。

超多尺寸：两款MOE模型：Qwen3-235B-A22B（2350多亿总参数、 220多亿激活参数）、Qwen3-30B-A3B（300亿总参数、30亿激活参数），以及六个Dense模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B。
推理能力大幅提升：在数学、代码和逻辑推理等评测中，显著超过QwQ（推理模式）和Qwen2.5-Plus-Instruct（非推理模式），达到同规模业界SOTA水平。
模型人类偏好能力显著增强：创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升，用户体验预期明显更佳，通用能力显著超过Qwen2.5-Plus-Instruct。
Agent能力显著增强：在上述两种模式下都达到目前业界领先水平，能够实现精准的外部工具调用。