阿里云百炼平台推出的Qwen 3.7系列包含两款核心模型——Qwen 3.7 Max与Qwen 3.7 Plus,二者定位差异显著:Max是纯文本旗舰,专注极致推理与长文本连贯性;Plus是多模态全能选手,新增图像、视频理解能力,且成本大幅降低。两款模型共享100万Tokens上下文窗口与35小时自治执行上限,但在模态、输出长度、架构、价格与适用场景上存在本质区别。以下从核心参数、多模态能力、文本推理、编程能力、成本性价比、选型建议六大维度,结合实测数据全面解析两款模型的差异,为开发者与企业提供选型参考。
一、核心参数与定位:纯文本旗舰 vs 多模态全能
(一)基础参数对比
Qwen 3.7 Max:纯文本模型,无视觉能力;采用全参数密集架构,专注极致推理与长文本连贯性;最大输出65536 Tokens;输入2.50元/百万Tokens,输出7.50元/百万Tokens,综合成本为Plus的6倍左右。核心定位是高强度智能体、百万行代码重构、超长文档深度分析、高精度金融/法律推演等对文本能力要求极高的专业场景。详情👉访问阿里云百炼大模型服务平台页面 了解

Qwen 3.7 Plus:多模态模型,支持文本+图像+视频输入输出;采用MoE混合专家架构,单轮推理仅激活170亿参数,兼顾性能与效率;最大输出32768 Tokens;输入0.40元/百万Tokens,输出1.60元/百万Tokens,性价比突出。核心定位是通用多模态交互、图文内容生成、视觉问答、文档图像解析、轻量化智能体等场景,兼顾能力与成本。
(二)架构与性能差异
Max采用全参数密集架构,所有参数全程参与推理,在纯文本推理、长文本连贯性、复杂逻辑推演上具备优势,但推理成本高、速度较慢。Plus采用MoE混合专家架构,动态激活部分参数,在保证核心能力的同时,大幅降低推理成本、提升速度,且新增多模态能力,适配更广泛场景。
二、多模态能力:Plus独家优势,Max纯文本专注
(一)Plus多模态能力实测
Plus支持图像输入、图像理解、图像生成、视频理解、图文问答等多模态能力,可直接处理截图、文档扫描件、图表、视频帧等非文本数据。实测中,Plus可精准识别图像中的文字、表格、图表信息,完成图文内容总结、视觉问答、文档图像解析等任务;支持视频帧采样分析,理解视频内容并生成摘要;新增视觉工具调用能力,可操作GUI界面、读取屏幕内容,实现更全面的自动化。详情👉访问阿里云百炼大模型服务平台页面 了解

(二)Max纯文本能力专注
Max不支持任何图像、视频输入输出,仅专注于纯文本处理。在纯文本场景下,Max的推理连贯性、长文本输出能力略优于Plus,但无多模态扩展能力,无法处理非文本数据。
三、文本推理能力:Max极致连贯,Plus高效均衡
(一)数学与逻辑推理
在数学能力测试中,开启思考模式后,Plus的单次运行得分与Max持平。15道AIME竞赛级数学题中,两款模型均答对14道,准确率一致。但在推理速度上,Plus单题平均耗时113秒,Max为303秒,Plus速度提升近3倍。在复杂逻辑推理、多步骤问题解决场景中,Max的连贯性略优,Plus则在速度与效率上占据优势。
(二)超长文本处理
两款模型均支持100万Tokens上下文,可处理百万字文档、百万行代码、长对话历史。Max因更大的输出长度(65536 Tokens),在生成超长报告、完整代码库时更具优势;Plus的32768 Tokens输出长度,已能满足绝大多数超长文本处理的输出需求,且处理速度更快。
(三)内容创作与理解
在日常内容创作、文档总结、问答交互等通用文本场景中,两款模型表现接近,Plus的响应速度更快,Max的文本连贯性与深度略优。对于需要极致文本质量的专业创作、学术写作、法律文书等场景,Max更具优势;对于追求效率与成本的通用内容场景,Plus性价比更高。
四、编程与代码能力:Max专业领先,Plus满足主流需求
(一)代码生成与调试
Max在超长代码仓库处理、复杂算法实现、多语言混合编程中精度略高,适合专业软件开发、AI编程平台等场景。Plus在日常代码编写、Bug修复、脚本开发中表现接近Max,实测10个真实Bug修复任务全部成功(10/10),满足绝大多数开发者需求。
(二)工具调用与兼容性
两款模型均兼容OpenAI、Anthropic API协议,支持主流工具调用,原有AI开发与智能体工作流无需改动,可一键升级。Plus新增视觉工具调用能力,可结合图像理解实现更复杂的自动化开发场景。
五、成本与性价比:Plus成本优势显著,Max适合极致场景
(一)价格对比(2026年百炼官方)
Qwen 3.7 Max:输入2.50元/百万Tokens,输出7.50元/百万Tokens;缓存输入享90%折扣,低至0.25元/百万Tokens。
Qwen 3.7 Plus:输入0.40元/百万Tokens,输出1.60元/百万Tokens;输入价格为Max的1/6,输出为Max的1/4.7,综合成本仅为Max的1/5-1/6。详情👉访问阿里云百炼大模型服务平台页面 了解

(二)成本效益分析
日常场景(办公、内容创作、简单代码、智能客服等):Plus的综合成本仅为Max的1/6,且具备多模态能力,性价比碾压Max,是绝大多数场景的首选。
专业场景(高强度智能体、百万行代码重构、超长文档深度分析、高精度金融/法律推演等):Max的极致文本能力具备不可替代性,虽成本高,但能满足专业需求,适合预算充足、追求极致能力的场景。
(三)成本优化技巧
Plus:采用阶梯定价,单次输入≤256K时,输入2元/百万、输出8元/百万;>256K时恢复标准价。合理拆分请求,控制单次输入长度,可进一步降低成本。
Max:开启上下文缓存,输入享90%折扣,适合重复调用相同上下文的场景。
六、选型建议:按场景精准匹配,平衡能力与成本
(一)优先选择Qwen 3.7 Plus的场景
- 多模态交互场景:需要处理图像、视频、图文混合内容,如视觉问答、文档图像解析、图文内容生成。
- 通用开发场景:日常代码编写、Bug修复、脚本开发、轻量化智能体,追求效率与成本平衡。
- 预算有限场景:个人开发者、中小企业,希望以低成本获得强大AI能力。
- 速度优先场景:需要快速响应的实时交互、自动化任务,Plus推理速度比Max快近3倍。
(二)优先选择Qwen 3.7 Max的场景
- 纯文本极致场景:高强度智能体、百万行代码重构、超长文档深度分析、高精度金融/法律推演。
- 长文本输出场景:需要生成超长报告、完整代码库、学术论文等,Max最大输出65536 Tokens,远超Plus。
- 专业开发场景:专业软件开发、AI编程平台,对代码精度、推理连贯性要求极高。
七、总结
阿里云百炼Qwen 3.7 Max与Plus是两款定位清晰、互补性强的模型。Max作为纯文本旗舰,以更高成本换取极致推理、长文本连贯性与专业编程能力,适合对文本能力要求极高的专业场景。Plus作为多模态全能选手,新增图像、视频理解能力,综合成本仅为Max的1/6,推理速度更快,满足绝大多数通用与多模态场景需求,性价比突出。
选型核心原则:多模态场景必选Plus,纯文本专业场景选Max,通用场景优先Plus。开发者与企业可根据自身场景需求、预算限制,精准选择模型,平衡能力与成本,实现AI能力的高效落地。