阿里云Qwen3.6全新开源,三步完成专有版部署!

简介: Qwen3.6是阿里云全新MoE架构大模型系列,稀疏激活显著降低推理成本,兼顾顶尖性能与高性价比;支持多规格、FP8量化、原生Agent及100+语言,开箱即用。

模型简介

Qwen3.6 是阿里云通义千问团队最新推出的新一代混合专家(MoE)大语言模型系列,覆盖从轻量到旗舰的多个规格,满足不同业务场景对性能与成本的差异化需求。Qwen3.6 系列采用 MoE 稀疏激活架构,推理时激活参数量远低于总参数量,在保持顶尖推理、代码和指令遵循能力的同时,将部署成本压缩至同规模稠密模型的数分之一。

Qwen3.6 系列的核心优势:

  • 稀疏激活,高效推理:MoE 架构每次推理仅激活少量专家参数,显存占用与推理延迟大幅优于同参数量稠密模型,GPU 利用率更高
  • 综合能力全面领先:在推理、数学、代码生成、指令遵循和多语言理解等主流基准上超越同量级开源模型
  • 多规格灵活选择:提供标准版(BF16)与 FP8 量化版,FP8 版相比 BF16 显存占用减少约 50%,推理吞吐显著提升,适合对成本敏感的生产场景
  • 工具调用与 Agent 就绪:原生支持 Function Calling 和多步 Agent 工作流,可直接用于构建复杂 AI 应用
  • 多语言支持:覆盖中文、英文等 100+ 语言,跨语言理解与生成能力全面

部署步骤

  1. 计算巢模型市场中找到目标 Qwen3.6 模型,点击「开始部署」,或通过以下链接直达模型市场:https://computenest.console.aliyun.com/ai-lab/model/cn-hangzhou image.png
  2. 平台支持 vLLM 部署框架,部署参数均已提供默认配置,无需额外修改即可一键部署。

注意:1.选择 ACS 集群部署时,在使用 GU8TF / GU8TEF / P16EN 等大显存 GPU 卡型时,需要提交工单申请对应 GPU 卡型白名单后方可部署,工单产品分类选择「容器计算服务 ACS」。

2.使用ECS部署时,CPU核数过少也会导致模型输出慢。

image.png

  1. 部署成功后,即可在服务实例概览页查看 API 调用示例、访问地址和 ApiKey,立即开始调用。 image.png 快速验证示例:
curl -X POST http://${ServerIP}:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${ApiKey}" \
  -d '{
    "model": "${ModelName}",
    "stream": true,
    "messages": [{"role": "user", "content": "介绍一下你自己"}]
  }'

更多模型支持

计算巢模型市场持续提供开源社区热门模型的快速部署,模型覆盖 Qwen、DeepSeek、Kimi、GLM 等系列,同时联合 ACS 团队提供了 PD 分离的高性能推理方案,欢迎大家使用。

部署过程遇到问题,可以加入官方钉钉群咨询:

image.png

相关文章
|
26天前
|
弹性计算 人工智能 自然语言处理
阿里云Qwen3.6 MoE大模型全新开源详解:模型特性、ECS/ACS/计算巢部署流程、vLLM配置与代码调用全教程
阿里云Qwen3.6系列是通义千问团队推出的新一代混合专家(MoE)架构大语言模型,凭借稀疏激活、高效推理、多规格覆盖、原生支持智能体与多语言能力,成为企业私有化部署、AI应用开发、智能体构建的理想选择。该系列全面开源,依托阿里云计算巢平台可实现三步一键部署专有版,搭配vLLM推理框架大幅提升吞吐效率,FP8量化版本更让显存占用降低约一半,兼顾顶尖性能与极致成本优势。本文从模型定位、核心优势、规格选型、阿里云计算巢部署流程、API调用代码、环境配置、常见问题全方面展开,为开发者与企业提供完整可落地的实战指南。
1657 7
|
29天前
|
人工智能 测试技术 API
Qwen3.6-Max-Preview震撼发布!登顶国产模型榜首,智能体编程能力再攀高峰
阿里云通义实验室发布Qwen3.6-Max-Preview预览版,通义大模型官网:https://t.aliyun.com/U/JbblVp 登顶“最佳国产大模型”。其在智能体编程、世界知识与指令遵循三大维度全面超越前代,支持多工具协同、长程任务与思维链保留(preserve_thinking),已上线百炼API及Qwen Studio。
|
22天前
|
人工智能 运维 安全
阿里云Qwen3.6-27B是什么?阿里云Qwen3.6-27B 解析:稠密架构、百万上下文与企业级部署
阿里云Qwen3.6-27B是通义千问团队推出的一款**270亿参数稠密型多模态大语言模型**,以“小参数、强性能”为核心定位,在编程能力、长文本处理、多模态理解与智能体执行等方面实现突破性表现,是面向开发者与企业的新一代开源旗舰模型。该模型采用Apache 2.0开源协议,支持完全商用、本地部署与二次开发,凭借稠密架构的简洁性、百万级上下文能力与媲美千亿模型的智能体表现,成为当前开源社区的热门选择。以下从技术架构、核心能力、性能表现、部署方式与应用场景等维度,全面解析Qwen3.6-27B的全貌。
1498 3
|
1月前
|
人工智能 开发框架 文字识别
Qwen3.6 正式发布!阿里云百炼同步开启“AI大模型节省计划”超值优惠
阿里云发布千问Qwen3.6系列大模型,大模型官网:https://t.aliyun.com/U/JbblVp 实现编程、智能体(Agent)及多模态能力的范式跃迁:代码生成与调试更精准,原生支持LangChain等框架,工具调用更稳定,图文识别与推理全面升级。Qwen3.6-Flash轻量高效,开发体验优化。同步推出百炼「全模型通享」限时特惠,新客首月立减最高500元。
1102 1
|
1月前
|
人工智能 自然语言处理 数据可视化
白嫖7000万Tokens!阿里云百炼新用户专享,零成本玩转通义千问等70+大模型
阿里云百炼新用户专享:开通即赠超7000万Tokens!百炼官网:https://t.aliyun.com/U/fPVHqY 零门槛、免绑卡,可免费调用通义千问等70+主流大模型,支持AI编程、智能客服、内容创作等场景,价值数百元,有效期90天。
922 2

热门文章

最新文章