计算巢模型市场支持一键部署Qwen3.5模型

简介: Qwen3.5是阿里云全新多模态大模型,3970亿参数、仅激活170亿,支持256K上下文(可扩至1M)、201种语言及视觉理解与Agent能力,性能媲美顶级闭源模型,登顶最强开源大模型。计算巢一键部署,支持SGLang/vLLM,即开即用。

模型简介

Qwen3.5(通义千问3.5)是阿里云推出的新一代原生多模态大语言模型,采用线性注意力与稀疏MoE混合架构,总参数量达3970亿,每次推理仅激活170亿参数,实现卓越的推理效率。模型支持256K原生上下文(可扩至1M)、201种语言,具备强大的视觉理解和Agent能力,可自主操作手机与电脑完成复杂任务。在推理、编程、多模态理解等基准评估中,性能媲美Gemini-3-Pro、GPT-5.2等顶级闭源模型,登顶全球最强开源大模型。

部署步骤

  1. 在计算巢模型市场中找到Qwen3.5模型,点击“开始部署”,或通过链接直达该模型:https://computenest.console.aliyun.com/ai-lab/model/cn-hangzhou/Qwen3.5-397B-A17B
    img.png
  1. 平台支持SGLang、vLLM部署框架,部署参数大多提供有默认配置,无需修改即可一键部署。

注意:选择ACS集群部署时,在使用GU8TF/GU8TEF/P16EN等显存较大的GPU卡型时,需要提交工单申请对应的GPU卡型白名单后才可进行部署,工单产品分类选择"容器计算服务ACS"。

img_1.png
img_4.png
img_3.png

  1. 部署成功后,即可按概览页上的Api调用示例进行调用。
    img_7.png

更多模型支持

计算巢模型市场持续提供开源社区热门模型的快速部署,模型覆盖Qwen、DeepSeek、Kimi、GLM等开源优秀模型,同时联合ACS团队提供了PD分离的高性能推理方案,欢迎大家使用。

部署过程遇到问题,可以加入官方钉钉群咨询:
img_6.png

相关文章
|
27天前
|
机器学习/深度学习 测试技术 API
Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力
通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)
4598 23
|
1月前
|
机器学习/深度学习 自然语言处理 API
Qwen3.5:迈向原生多模态智能体
除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。
2545 4
Qwen3.5:迈向原生多模态智能体
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus,全球最强开源大模型:3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与视觉编程;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus:全球最强开源大模型,3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与长视频分析;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
|
9天前
|
人工智能 运维 Serverless
零配置部署顶级模型!函数计算一键解锁 Qwen3.5
阿里云开源千问Qwen3.5-397B-A17B,3970亿参数、仅激活170亿,性能登顶全球最强开源模型!依托函数计算FC,支持Serverless GPU一键部署,5分钟上线,显存降60%、吞吐提19倍,零门槛玩转多模态大模型。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
除夕夜,国产顶流压轴上线,QWEN3.5多模态开源!
加我进AI讨论学习群,公众号右下角“联系方式” 文末有老金的 **开源知识库地址·全免费** --- ![Image](https://ucc.alicdn.com/pic/developer-ecology/p3shvhj26rigq_682da514f2d84d68857b797ebe2fbced.jpg) 除夕夜,老金我刚咬了一口韭菜鸡蛋饺子。 手机"叮"的一声,弹出个通知。 老金我瞄
|
2月前
|
人工智能 缓存 物联网
从0到1:大模型算力配置不需要人,保姆级选卡与显存计算手册
本文深入解析大模型算力三阶段:训练、微调与推理,类比为“教育成长”过程,详解各阶段技术原理与GPU选型策略,涵盖显存计算、主流加速技术(如LoRA/QLoRA)、性能评估方法及未来趋势,助力开发者高效构建AI模型。
623 2
|
1月前
|
机器学习/深度学习 API
Qwen3.5 开源家族扩容!
通义千问Qwen3.5系列重磅开源:含397B、122B、35B、27B四款模型,覆盖高性能与高性价比场景;新增Qwen3.5-Flash API,支持百万token上下文及原生工具链,已在阿里云百炼上线。
2187 4

热门文章

最新文章