备案控制台

开发者社区开发与运维文章正文

通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o

2024-09-19 5653

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o

9月19日云栖大会，阿里云CTO周靖人宣布，通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

相比上一代模型，Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐，最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上，Qwen-Max表现接近GPT-4o，数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。

相比2023年4月的初代通义千问大模型，Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%，模型与人类偏好的对齐水平更是有了质的飞跃，提升了700%以上。

文章标签：

云栖大会

API

关键词：

通义大模型升级

通义大模型qwen

通义大模型性能

通义通义大模型

千问通义大模型

阿里云新鲜事

目录

相关文章

TsingtaoAI

|

2月前

|

人工智能新制造云栖大会

TsingtaoAI亮相云栖大会，AI大模型赋能传统制造业焕新升级

2025年9月24日，杭州云栖小镇，2025云栖大会盛大开幕。作为全球AI技术与产业融合的重要平台，本届大会以“AI驱动产业变革”为主题，集中展示大模型技术在各领域的创新应用。其中，由西湖区商务局牵头组织的“AI大模型应用与产业融合”专场论坛成为大会亮点之一，吸引了来自政府、企业及投资机构的百余名代表参与。在论坛上，TsingtaoAI作为制造业智能化转型的代表企业，分享了在具身智能-制造企业的AI应用实践。

TsingtaoAI

106 1 1

modelscope

|

3月前

|

分布式计算测试技术 Spark

科大讯飞开源星火化学大模型、文生音效模型

近期，科大讯飞在魔搭社区（ModelScope）和Gitcode上开源两款模型：讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly，助力前沿化学技术研究，以及声音生成技术和应用的探索。

modelscope

305 2 2

varin

|

3月前

|

人工智能 Java API

AI 超级智能体全栈项目阶段一：AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式（SDK/HTTP/SpringAI/langchain4j）

本文介绍AI大模型的核心概念、分类及开发者学习路径，重点讲解如何选择与接入大模型。项目基于Spring Boot，使用阿里云灵积模型（Qwen-Plus），对比SDK、HTTP、Spring AI和LangChain4j四种接入方式，助力开发者高效构建AI应用。

varin

1537 122 129

AI 超级智能体全栈项目阶段一：AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式（SDK/HTTP/SpringAI/langchain4j）

代码bug生产队

|

2月前

|

人工智能搜索推荐程序员

当AI学会“跨界思考”：多模态模型如何重塑人工智能

当AI学会“跨界思考”：多模态模型如何重塑人工智能

代码bug生产队

291 120 120

aliyun9170107523-43660

|

2月前

|

机器学习/深度学习人工智能自然语言处理

34_GPT系列：从1到5的架构升级_深度解析

大型语言模型(LLM)的发展历程中，OpenAI的GPT系列无疑扮演着至关重要的角色。自2018年GPT-1问世以来，每一代GPT模型都在架构设计、预训练策略和性能表现上实现了质的飞跃。本专题将深入剖析GPT系列从1.17亿参数到能够处理百万级token上下文的技术演进，特别关注2025年8月8日发布的GPT-5如何引领大模型技术迈向通用人工智能(AGI)的重要一步。

aliyun9170107523-43660

330 2 2

modelscope

|

3月前

|

自然语言处理机器人图形学

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

腾讯混元图像3.0，真的来了——开源，免费开放使用。正式介绍一下：混元图像3.0（HunyuanImage 3.0），是首个工业级原生多模态生图模型，参数规模80B，也是目前测评效果最好、参数量最大的开源生图模型，效果可对…

modelscope

819 2 2

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

八进智

|

2月前

|

缓存物联网 PyTorch

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

八进智

549 2 2

aliyun9170107523-43660

|

2月前

|

存储机器学习/深度学习人工智能

54_模型优化：大模型的压缩与量化

随着大型语言模型(LLM)的快速发展，模型规模呈指数级增长，从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本，同时也给部署和推理带来了巨大挑战。2025年，大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践，探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署，为企业和开发者提供全面的技术指导。

aliyun9170107523-43660

200 0 0

aliyun9170107523-43660

|

2月前

|

机器学习/深度学习人工智能自然语言处理

38_多模态模型：CLIP的视觉-语言对齐_深度解析

想象一下，当你看到一张小狗在草地上奔跑的图片时，你的大脑立刻就能将视觉信息与"小狗"、"草地"、"奔跑"等概念联系起来。这种跨模态的理解能力对于人类来说似乎是理所当然的，但对于人工智能系统而言，实现这种能力却经历了长期的技术挑战。多模态学习的出现，标志着AI从单一模态处理向更接近人类认知方式的综合信息处理迈出了关键一步。

aliyun9170107523-43660

663 0 0

热门文章

最新文章

【大模型微调】一文掌握5种大模型微调的方法

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AI大模型入门七核心概念深度解析：参数量、Token、上下文窗口、上下文长度与温度

大模型微调技术：LoRA原理与实践

【万字长文】大模型训练推理和性能优化算法总结和实践

百度PaddleOCR-VL多模态文档解析方案开源发布，0.9B参数问鼎SOTA

构建AI智能体：一、初识AI大模型与API调用

大模型推理优化技术：KV缓存机制详解

AI Agent的未来之争：任务规划，该由人主导还是AI自主？——阿里云RDS AI助手的最佳实践

大模型强化学习的熵控制：CE-GPPO、EPO与AsyPPO技术方案对比详解

当AI开始“思考”：为什么大模型的尽头是推理？

大模型分布式推理：张量并行与流水线并行技术

构建AI智能体：一、初识AI大模型与API调用

【大模型微调】一文掌握5种大模型微调的方法

从“看见”到“预见”：合合信息“多模态文本智能技术”如何引爆AI下一场革命。

AI Agent的未来之争：任务规划，该由人主导还是AI自主？——阿里云RDS AI助手的最佳实践

C3仓库AI代码门禁通用实践：基于Qwen3-Coder+RAG的代码评审

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AI Agent越用越笨？阿里云AnalyticDB「AI上下文工程」一招破解！

相关课程

更多

阿里云大模型工程师ACA认证免费课程

阿里云百炼大模型产品实践

ADB-PG+大模型一站式AIGC解决方案

阿里云百炼，手把手教你如何构建企业大模型应用服务

云原生AI套件：一键训练大模型及部署GPU共享推理服务

【开眼界】大模型时代的个人应对策略

相关电子书

更多

OpenSearch向量检索和大模型方案

通义万相：视觉生成大模型的进化与应用

达摩院通义视觉生成大模型

相关实验场景

更多

通过GPU云服务器生成个人版对话大模型

如何快速训练大模型

如何快速体验调用通义大模型

在云上部署ChatGLM2-6B大模型（GPU版）

使用AI容器镜像部署Qwen大语言模型

下一篇

对象存储OSS快速上手——如何使用ossbrower2