Qwen3有效融合推理模式和非推理模式,一个模型同时兼具之前QwQ模型(推理模式,用于数学、代码、逻辑推理等场景)和instruct模型(非推理模式,通用对话等场景)的回复能力。
- 超多尺寸:两款MOE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数)、Qwen3-30B-A3B(300亿总参数、30亿激活参数),以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B。
- 推理能力大幅提升:在数学、代码和逻辑推理等评测中,显著超过QwQ(推理模式)和Qwen2.5-Plus-Instruct(非推理模式),达到同规模业界SOTA水平。
- 模型人类偏好能力显著增强:创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳,通用能力显著超过Qwen2.5-Plus-Instruct。
- Agent能力显著增强:在上述两种模式下都达到目前业界领先水平,能够实现精准的外部工具调用。
旗舰模型Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。
小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹, Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
关注通义大模型
感谢众多朋友一直以来对通义大模型的鼎力支持!也欢迎更多新朋友了解我们,提供更多的体验反馈,帮助我们变得更好!可以通过扫描下面通义大模型公众号二维码,关注一下通义大模型哦~可以在里面快速获得通义大模型的相关资讯,后续有产品新动态都会在上面更新,方便您及时了解最新产品信息。
🏀如果想要了解更多通义大模型的模型详细信息以及直接进入体验,可以点击🔗https://www.aliyun.com/product/tongyi直接进入查看和体验哦~~
目前上阿里云百炼体验Qwen3,每个模型免费获得各100万 Token,有效期为百炼开通后180天内,qwen-plus-2025-04-28、qwen-turbo-2025-04-28已升级Qwen3,赶快来体验一下Qwen3的能力吧~~
👉Qwen3模型直接体验入口🔗https://bailian.console.aliyun.com/?tab=model#/model-market?name=qwen3
如果在此过程中有任何的疑问都可以在评论区中留言探哦~~