一、Qwen 3.7系列核心定位与基础参数
2026年阿里云推出的Qwen 3.7系列包含Plus与Max两款核心模型,二者共享100万tokens超长上下文窗口与35小时自治执行上限,但在模态能力、底层架构、输出上限与资费标准上存在本质差异,分别面向不同量级与类型的AI应用场景。
Qwen 3.7 Max是纯文本旗舰模型,无视觉/视频处理能力,采用全参数密集架构,参数量约1.2T,推理时激活约450亿参数,专注极致文本推理、长文本连贯性与复杂逻辑推演,最大输出Tokens为65536,推理速度在纯文本场景下比Plus快7%-15%。其核心定位是高强度智能体、百万行代码重构、超长文档深度分析、高精度金融/法律推演等对文本能力要求极高的专业场景。详情👉访问阿里云百炼大模型服务平台页面 了解

Qwen 3.7 Plus是多模态全能模型,原生支持文本+图像+视频输入,打破纯文本模型的能力边界。采用MoE混合专家架构,参数量约350亿,单轮推理仅激活170亿参数,在保证性能的同时大幅提升推理效率,最大输出长度为32768 tokens,虽略低于Max,但足以覆盖绝大多数多模态场景需求。Plus定位面向需要图文视频协同处理、追求成本效益的通用与多模态场景。
二、底层架构与技术特性差异
(一)架构设计差异
Max采用全参数密集架构,所有参数在推理时均参与计算,这种架构能最大化利用计算资源,在纯文本推理、复杂逻辑推演、超长文本生成等场景下,保证推理精度与连贯性。但全参数激活也带来更高的计算成本与资源消耗,这也是其定价更高的核心原因之一。
Plus采用MoE混合专家架构,将模型拆分为多个专家子网络,单轮推理仅激活部分专家网络(约170亿参数),在保证核心能力的前提下,大幅降低计算量与推理成本。这种架构在多模态任务中表现优异,能高效处理文本、图像、视频的跨模态信息融合,同时保持较高的推理速度。
(二)上下文与输出能力
两款模型均支持100万tokens的超长上下文窗口,可处理百万级字符的文档、代码库、对话历史,满足复杂场景下的长文本理解需求。但在输出能力上存在差异:Max最大输出长度为65536 tokens,适合生成超长报告、完整代码仓库、深度分析文档等;Plus最大输出长度为32768 tokens,虽不及Max,但已能覆盖绝大多数多模态场景下的输出需求,如图文分析报告、视频内容摘要、多轮对话回复等。
(三)自治执行能力
二者均支持35小时的自治执行上限,可长时间独立完成复杂任务,如持续代码调试、长文档分析、多轮智能体交互等。在纯文本自治任务中,Max因全参数架构优势,稳定性与连贯性略优;而Plus在多模态自治任务中,如持续分析视频流、处理图文混合任务,具备Max无法比拟的优势。
三、多模态能力实测对比
(一)Plus独有多模态能力
Plus原生支持图像与视频理解,是其核心差异化优势。在图像理解方面,Plus可精准识别截图、图表、UI设计、手写笔记、文档图片等,完成OCR文本提取、图表数据分析、UI元素识别、内容语义理解等任务。例如,上传产品原型图,Plus可自动解析界面布局、功能模块,生成对应的前端代码框架;上传财务报表图片,可提取数据并生成分析报告。详情👉访问阿里云百炼大模型服务平台页面 了解

在视频理解方面,Plus支持视频帧序列分析,可理解视频内容、提取关键信息、生成视频摘要、识别视频中的文本与图像内容。例如,上传教学视频,Plus可自动提取知识点、生成课程笔记;上传监控视频片段,可分析画面内容、识别异常事件。
(二)Max的模态能力局限
Max为纯文本模型,完全不具备任何图像、视频处理能力。若业务场景需要处理视觉信息,Max无法直接支持,必须搭配其他视觉模型,这会增加开发复杂度与额外成本。例如,在智能客服场景中,若用户上传问题截图,Max无法解析,只能引导用户文字描述;在内容创作场景中,无法基于图片生成文案或分析视觉内容。
(三)多模态场景实测表现
在Vision Arena多模态评测中,Qwen 3.7 Plus已排至第16位,在图像理解、图文问答等任务中表现优异。实测中,Plus处理10张不同类型的图片(含截图、图表、手写体、UI设计),OCR准确率达98%以上,图表数据分析准确率超95%,UI元素识别与代码生成成功率达90%以上。在视频理解任务中,处理10段1-5分钟的视频,关键信息提取准确率达92%,视频摘要生成质量与人工摘要一致性评分达85分以上。
四、纯文本能力实测对比
(一)通用文本能力
在通用文本任务(如文本生成、摘要、翻译、问答)中,两款模型表现接近,Max在推理精度上略优,但差距较小。在标准文本基准测试中,Max的Intelligence Index为56.6,Plus为52.1,差距约4.5个百分点。日常办公、内容创作、简单问答等场景中,二者效果几乎无差异,用户难以感知明显区别。
(二)代码能力
代码能力是两款模型的核心优势之一。在Bug修复测试中,Plus在10个真实Bug修复任务中全部成功(10/10),而Max得分为9/10,Plus表现更优。在复杂代码生成、代码重构、多文件代码处理场景中,Max因更大的输出长度与全参数架构,在处理超大规模代码库时表现更稳定;Plus则在代码生成速度上优势明显,端到端吞吐量达147.5 t/s,是Max的3倍以上。
(三)数学与逻辑推理
在数学能力测试中,开启思考模式后,Plus的单次运行得分与Max持平。在15道AIME竞赛级数学题中,两款模型均答对14道,准确率一致。但在推理速度上,Plus单题平均耗时113秒,Max为303秒,Plus速度提升近3倍。在复杂逻辑推理、多步骤问题解决场景中,Max的连贯性略优,Plus则在速度与效率上占据优势。
(四)超长文本处理
两款模型均支持100万tokens上下文,在超长文档分析、百万行代码处理、长对话历史理解场景中表现优异。Max因更大的输出长度(65536 tokens),在生成超长报告、完整代码库时更具优势;Plus的32768 tokens输出长度,已能满足绝大多数超长文本处理的输出需求,且在处理速度上更快。
五、性价比与成本实测分析
(一)价格对比(2026年官方标准)
Qwen 3.7 Max:输入2.50元/百万tokens,输出7.50元/百万tokens。
Qwen 3.7 Plus:输入0.40元/百万tokens,输出1.60元/百万tokens。
综合来看,Plus的综合成本仅为Max的1/6左右,性价比优势极其显著。
(二)实测成本对比
以典型业务场景(100万tokens输入+50万tokens输出)为例:
- Max成本:100万×2.50元 + 50万×7.50元 = 250元 + 375元 = 625元
- Plus成本:100万×0.40元 + 50万×1.60元 = 40元 + 80元 = 120元
同等业务量下,Plus可节省80%以上的成本,长期使用可大幅降低AI服务支出。
(三)成本效益分析
- 日常通用场景:办公、内容创作、简单代码、智能客服、通用问答等场景,Plus的文本能力已足够,成本仅为Max的1/6,性价比优势明显,可大幅降低AI使用成本。
- 多模态场景:Plus独家支持图像、视频理解,无需额外付费即可获得多模态能力,而Max无法处理此类任务,必须搭配其他视觉模型,总成本更高。
- 极致文本场景:复杂推理、超长文档生成、高强度智能体、超大规模代码处理等场景,Max的性能优势可带来更好的业务效果,虽成本更高,但对于核心业务而言,投入产出比依然可观。
六、场景适配与选型建议
(一)优先选择Qwen 3.7 Plus的场景
- 多模态业务:需要处理图像、视频的场景,如智能客服(支持截图咨询)、内容创作(图文协同)、教育(视频/图片教学)、电商(商品图片分析)、医疗(医学影像辅助分析)等。
- 成本敏感型业务:中小企业、个人开发者、大规模通用AI服务,追求低成本、高性价比,Plus可在保证性能的前提下,大幅降低使用成本。
- 速度优先场景:需要快速响应的实时交互场景,如实时问答、即时代码生成、快速数据分析,Plus的推理速度优势明显。
- 通用AI应用:日常办公、内容创作、简单代码开发、通用智能助手等,Plus的能力完全满足需求,且成本更低。详情👉访问阿里云百炼大模型服务平台页面 了解


(二)优先选择Qwen 3.7 Max的场景
- 纯文本极致场景:对文本推理精度、连贯性、输出长度有极致要求的场景,如超长报告生成、百万行代码重构、深度法律/金融文本分析、高强度智能体开发等。
- 无视觉需求的专业场景:纯代码开发、纯文本数据分析、纯逻辑推理、超长对话系统等,无需处理任何视觉信息,Max的纯文本性能优势可充分发挥。
- 核心业务系统:对稳定性、精度要求极高的核心业务,如金融风控分析、法律文书生成、科研论文写作等,Max的极致文本能力可提供更可靠的结果。
七、实测总结与核心结论
- 核心差异:Max是纯文本旗舰,专注极致文本推理与超长输出;Plus是多模态全能,原生支持图文视频处理,成本仅为Max的1/6。
- 能力对比:多模态能力Plus独家领先;纯文本能力Max略优,但差距较小;代码、数学等任务中,Plus在速度与部分场景表现更优。
- 性价比:Plus性价比远超Max,日常与多模态场景优先选择Plus;仅纯文本极致场景,Max的投入产出比更合理。
- 选型原则:有视觉需求选Plus,成本敏感选Plus,速度优先选Plus;纯文本极致需求、核心专业场景选Max。
Qwen 3.7系列通过Plus与Max的差异化定位,覆盖了从通用多模态到专业纯文本的全场景需求,用户可根据业务场景、成本预算、能力需求灵活选型,在保证AI能力的同时,实现成本与效果的最优平衡。