文档备案控制台

开发者社区开发与运维文章正文

通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o

2024-09-19 12163

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o

9月19日云栖大会，阿里云CTO周靖人宣布，通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

相比上一代模型，Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐，最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上，Qwen-Max表现接近GPT-4o，数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。

相比2023年4月的初代通义千问大模型，Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%，模型与人类偏好的对齐水平更是有了质的飞跃，提升了700%以上。

文章标签：

云栖大会

API

关键词：

模型GPT

升级GPT

性能GPT

模型性能GPT

接近GPT

developer_article

目录

相关文章

八进智

|

9月前

|

缓存物联网 PyTorch

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

八进智

2627 2 2

TsingtaoAI

|

9月前

|

人工智能新制造云栖大会

TsingtaoAI亮相云栖大会，AI大模型赋能传统制造业焕新升级

2025年9月24日，杭州云栖小镇，2025云栖大会盛大开幕。作为全球AI技术与产业融合的重要平台，本届大会以“AI驱动产业变革”为主题，集中展示大模型技术在各领域的创新应用。其中，由西湖区商务局牵头组织的“AI大模型应用与产业融合”专场论坛成为大会亮点之一，吸引了来自政府、企业及投资机构的百余名代表参与。在论坛上，TsingtaoAI作为制造业智能化转型的代表企业，分享了在具身智能-制造企业的AI应用实践。

TsingtaoAI

683 1 1

代码bug生产队

|

9月前

|

人工智能搜索推荐程序员

当AI学会“跨界思考”：多模态模型如何重塑人工智能

当AI学会“跨界思考”：多模态模型如何重塑人工智能

代码bug生产队

1325 120 120

安全风信子

|

9月前

|

存储机器学习/深度学习人工智能

54_模型优化：大模型的压缩与量化

随着大型语言模型(LLM)的快速发展，模型规模呈指数级增长，从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本，同时也给部署和推理带来了巨大挑战。2025年，大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践，探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署，为企业和开发者提供全面的技术指导。

安全风信子

936 0 0

布客飞龙

|

存储算法数据建模

Python 金融编程第二版（GPT 重译）（一）（5）

Python 金融编程第二版（GPT 重译）（一）

布客飞龙

254 0 0

布客飞龙

|

存储 NoSQL 索引

Python 金融编程第二版（GPT 重译）（一）（4）

Python 金融编程第二版（GPT 重译）（一）

布客飞龙

381 2 2

布客飞龙

|

安全 Shell 网络安全

Python 金融编程第二版（GPT 重译）（一）（3）

Python 金融编程第二版（GPT 重译）（一）

布客飞龙

278 0 0

布客飞龙

|

算法 Linux Docker

Python 金融编程第二版（GPT 重译）（一）（2）

Python 金融编程第二版（GPT 重译）（一）

布客飞龙

337 0 0

布客飞龙

|

存储算法数据可视化

Python 金融编程第二版（GPT 重译）（一）（1）

Python 金融编程第二版（GPT 重译）（一）

布客飞龙

424 1 1

热门文章

最新文章

如何 3 行代码使用 arduino 接入阿里云物联网平台

Zero-Shot, One-Shot, and Few-Shot Learning概念介绍

Mac OS下maven安装与配置

软件界面有乱码是什么原因，如何解决？

【WEB】当HTTPS资源引入HTTP导致报错blocked:mixed-content （混合加载/Mixed Content）如何解决

Maven超细致史上最全Maven下载安装配置教学（2022更新...全版本）建议收藏...赠送IDEA配置Maven教程

kibana 报错 elasticsearch service Unavailable

mysql中有大量sleep进程的原因与解决办法

[20150204]关于位图索引5.txt

“线下试穿线上购买”的麦鞋趣电商模式成就了谁？

123_自监督任务变体：Causal LM详解 - GPT-style下一词预测机制与训练优化

34_GPT系列：从1到5的架构升级_深度解析

从CLIP到GPT-4V：多模态RAG背后的技术架构全揭秘

阿里云开发者必备：GPT 从核心原理到企业级部署的全流程指南

阿里云开发者的共性痛点 ——「自建 GPT + 云服务」方案？

Dify x AiOnly平台：手把手教你调用GPT-5从零构建AI工作流！

快速集成GPT-4o：下一代多模态AI实战指南

现代AI工具深度解析：从GPT到多模态的技术革命与实战应用

通过 Cursor CLI 使用 GPT-5 的教程

GPT-5首发夜：AI可以成为每个人的“创新搭子”吗？

相关课程

更多

阿里云大模型能力培训（永耀）

国家电网大模型ACP培训

大模型 Clouder认证：基于PAI ArtLab的AIGC设计基础

阿里云大模型工程师ACA认证课程

阿里云百炼大模型产品实践

相关电子书

更多

人人懂AI之从机器学习到大模型

驱动未来：面向大模型的智算网络

新能源汽车营销数字化：大模型在极氪汽车的应用

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！