重磅！千问最强模型正式发布

2026-01-29 31

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking：参数超万亿、预训练数据达36T Tokens，规模与能力均为当前最强。采用全新测试时扩展机制，推理更智能、更经济；原生Agent能力大幅增强，可自主调用工具。开发者与用户均可免费体验。

刚刚，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。

千问新模型通过总参数、强化学习、推理计算的极致规模扩展，实现了性能的大幅飞跃，在多项关键性能基准测试中刷新全球新纪录。同时，该模型采用全新测试时扩展机制，推理性能提升同时更经济，并大幅增强原生Agent能力，模型对话时可自主调用工具。

目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。此外，千问APP也即将接入新模型，所有用户都可免费体验千问最强模型。

体验地址👇

Qwen Chat：https://chat.qwen.ai/
百炼API：https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23
千问APP网页版：https://www.qianwen.com/

规模最大、能力最强的千问推理模型

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型，其总参数量超万亿（1T），预训练数据量高达36T Tokens。

此前，预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分，推理性能已让人惊艳；在此基础上，阿里通义团队进行了更大规模的强化学习后训练，全面提升了正式版Qwen3-Max-Thinking性能。

其中，在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中，千问旗舰推理模型刷新了数项最佳表现（SOTA）纪录，整体性能可媲美国际顶尖AI大模型。

测试时扩展机制，推理性能提升且更经济

在关键的模型推理能力提升中，千问新模型采用了一种全新的测试时扩展（Test-time Scaling）机制，推理性能提升的同时还更经济。

业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论很常见，冗余推理效率低下；而千问采用的这一机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算，因此获得更智能的推理结果。

基于这一推理技术创新，千问推理性能和推理效率大为提升，比如在启用工具的“人类最后的测试”HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8，录得当前所有模型的最高分。

大幅增强原生Agent能力，对话时自主调用工具

面向即将到来的智能体Agent时代，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

这种自适应的工具调用能力可在QwenChat上完整体验，Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能，提供专业人士一样水平的回答，更合用户心意、更智能、更流畅；同时，模型幻觉也大为降低，为解决真实复杂任务打下基础。

该能力源自于通义团队专门设计的训练流程。具体而言，在完成初步的工具使用微调后，团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练，使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

/ END /

来源 | 阿里云公众号

重磅！千问最强模型正式发布

规模最大、能力最强的千问推理模型

测试时扩展机制，推理性能提升且更经济

大幅增强原生Agent能力，对话时自主调用工具

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

重磅！千问最强模型正式发布

规模最大、能力最强的千问推理模型

测试时扩展机制，推理性能提升且更经济

大幅增强原生Agent能力，对话时自主调用工具

热门文章

最新文章

相关电子书