模型简介
Qwen3.5(通义千问3.5)是阿里云推出的新一代原生多模态大语言模型,采用线性注意力与稀疏MoE混合架构,总参数量达3970亿,每次推理仅激活170亿参数,实现卓越的推理效率。模型支持256K原生上下文(可扩至1M)、201种语言,具备强大的视觉理解和Agent能力,可自主操作手机与电脑完成复杂任务。在推理、编程、多模态理解等基准评估中,性能媲美Gemini-3-Pro、GPT-5.2等顶级闭源模型,登顶全球最强开源大模型。
部署步骤
- 在计算巢模型市场中找到Qwen3.5模型,点击“开始部署”,或通过链接直达该模型:https://computenest.console.aliyun.com/ai-lab/model/cn-hangzhou/Qwen3.5-397B-A17B

- 平台支持SGLang、vLLM部署框架,部署参数大多提供有默认配置,无需修改即可一键部署。
注意:选择ACS集群部署时,在使用GU8TF/GU8TEF/P16EN等显存较大的GPU卡型时,需要提交工单申请对应的GPU卡型白名单后才可进行部署,工单产品分类选择"容器计算服务ACS"。



- 部署成功后,即可按概览页上的Api调用示例进行调用。

更多模型支持
计算巢模型市场持续提供开源社区热门模型的快速部署,模型覆盖Qwen、DeepSeek、Kimi、GLM等开源优秀模型,同时联合ACS团队提供了PD分离的高性能推理方案,欢迎大家使用。
部署过程遇到问题,可以加入官方钉钉群咨询: