通义Qwen3-Max:大就是好

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 通义千问Qwen3-Max正式发布,参数超1T,训练稳定高效,在代码、推理、多语言等任务中表现卓越。预览版已登顶LMArena榜单前三,支持阿里云百炼API调用与Qwen Chat体验,敬请试用。

继 Qwen3-2507 系列发布之后,我们非常高兴地推出 Qwen3-Max —— 我们迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

我们诚邀您通过阿里云 API 体验 Qwen3-Max-Instruct,或直接在 Qwen Chat 上进行试用。与此同时,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力。在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。我们期待在不久的将来向公众正式发布这一版本。


QwenChat:

https://chat.qwen.ai/

阿里云百炼:

https://help.aliyun.com/zh/model-studio/models#qwen-max-cn-bj

image.png


Qwen3-Max-Base

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了我们提出的global-batch load balancing loss。

  • 训练稳定性:得益于Qwen3的MoE模型结构设计,Qwen3-Max的预训练loss稳定平滑。训练过程一气呵成,没有任何loss尖刺,也没有使用训练回退、改变数据分布等调整策略。
  • 训练高效性:在PAI-FlashMoE的高效多级流水并行策略优化下,Qwen3-Max-Base训练效率显著提升,其MFU相比Qwen2.5-Max-Base相对提升30%。在长序列训练场景中,我们进一步使用ChunkFlow策略获得了相比序列并行方案提升3倍的吞吐收益,支持Qwen3-Max 1M长上下文的训练。同时,通过SanityCheck、EasyCheckpoint、调度链路优化等多种手段,Qwen3-Max在超大规模集群上因硬件故障造成的时间损失下降为Qwen2.5-Max的五分之一。


Qwen3-Max-Instruct

Qwen3-Max-Instruct的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Qwen3-Max-Instruct 更是实现了突破性表现,以74.8分超越 Claude Opus 4与 DeepSeek-V3.1。

image.png

image.png

Qwen3-Max-Thinking(Heavy)

Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上,均取得了满分。目前,我们正在全力推进 Qwen3-Max-Thinking 的训练,期待尽快能让用户体验。

image.png

使用Qwen3-Max进行开发

现在,您可以在 Qwen Chat 官网(chat.qwen.ai)直接与强大的 Qwen3-Max-Instruct 模型对话,体验其卓越能力。同时,该模型的 API(模型名称为 qwen3-max)也已开放使用。

您只需按以下步骤操作,即可快速接入API:

注册阿里云账号:前往阿里云官网。

开通服务:激活阿里云 Model Studio。

获取密钥:登录控制台,创建您的专属 APIKey。

由于 Qwen 系列 API 完全兼容 OpenAI API 格式,您可直接沿用 OpenAI 调用方式。以下是一个使用 Python 调用 Qwen3-Max-Instruct 的示例代码:

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.getenv("API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3-max",
    messages=[
      {'role': 'user', 'content': 'Give me a short introduction to large language model.'}
    ]
)

print(completion.choices[0].message)



⛳如果还想要了解更多通义大模型的模型详细信息以及直接进入体验,可以点击🔗https://www.aliyun.com/product/tongyi直接进入查看和体验哦~~

也可以关注一下通义大模型的公众号,后续有新的产品动态都会在内发布。

通义大模型公众号二维码.png

相关文章
|
28天前
|
文字识别 自然语言处理 API
同时斩获两个开源第一,超火的通义Qwen3-VL CookBook来了
Qwen3-VL开源发布后广受认可,登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务,现推出详细Cookbook助力开发者高效应用。
504 3
|
27天前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
18天前
|
Kubernetes Java Go
Cloud Naive最佳开发实践
经过多年的工作,我们的精神导师John领悟了java那一套docker in docker的艺术并带到golang项目架构设计中。
371 49
|
4天前
|
监控 安全 数据库连接
深入理解Python上下文管理器:with语句的魔力
深入理解Python上下文管理器:with语句的魔力
208 114
|
人工智能 移动开发 自然语言处理
阿里云百炼产品月刊【2025年9月】
本月通义千问模型大升级,新增多模态、语音、视频生成等高性能模型,支持图文理解、端到端视频生成。官网改版上线全新体验中心,推出高代码应用与智能体多模态知识融合,RAG能力增强,助力企业高效部署AI应用。
669 0
|
24天前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
213 117
|
16天前
|
人工智能 移动开发 数据可视化
魔笔 AI Chat Builder:让 AI 对话秒变可交互界面
在 AI 应用高速发展的今天,开发者不仅要懂模型和接口,还要解决交互设计、功能集成、发布运维等“最后一公里”问题。 魔笔 AI Chat Builder 的使命,就是以 低门槛 + 高效率 帮助 开发者与非技术人员 在极短时间内构建、发布并运行专业 AI 应用,让 AI 真正快速落地业务。
魔笔 AI Chat Builder:让 AI 对话秒变可交互界面
|
26天前
|
人工智能 API 数据处理
Flink Agents 0.1.0 发布公告
Apache Flink Agents 0.1.0 首发预览版上线!作为 Flink 新子项目,它在流处理引擎上构建事件驱动的 AI 智能体,融合 LLM、工具、记忆与动态编排,支持高吞吐、低延迟、精确一次语义,实现数据与 AI 无缝集成,助力电商、金融等实时场景智能决策。
267 39