零配置部署顶级模型！函数计算一键解锁 Qwen3.5-阿里云开发者社区

零配置部署顶级模型！函数计算一键解锁 Qwen3.5

2026-04-02 787

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 函数计算FunModel平台支持云上一键部署Qwen3.5-397B-A17B，5分钟完成上线。依托Serverless+GPU，实现弹性扩缩容，轻松实现高性能、低成本AI应用落地。

作者：西流

就在最近，大模型圈再次迎来重磅炸弹！阿里巴巴开源了全新一代大模型——千问 Qwen3.5-397B-A17B，直接登顶全球最强开源模型宝座。

面对如此强大的模型，开发者们最关心的问题莫过于： “这么强的模型，部署起来会不会很麻烦？”

今天，我们就为大家带来一个 “神器级”解决方案——通过函数计算 FC 实现一键部署 Qwen3.5，让顶级模型的计算力触手可及！

模型介绍

这次开源的 Qwen3.5-397B-A17B 可不是普通的模型升级，它在架构和性能上都实现了质的飞跃：

性能超过万亿参数的 Qwen3-Max 模型，是目前全球最强开源模型，总参数 3970 亿，但激活参数仅 170 亿。采用创新的混合架构（线性注意力 Gated Delta Networks + 稀疏混合专家 MoE），在保持能力的同时优化了速度与成本。
成本降低：部署显存占用降低 60%，推理效率大幅提升，最大推理吞吐量可提升至 19 倍！
全能选手 ：作为原生视觉 - 语言模型，在推理、编程、智能体能力与多模态理解上表现优异。语言支持从 119 种扩展至 201 种，全球通用。

函数计算解决方案

传统部署大模型，你通常需要面对：

复杂的 GPU 环境配置
繁琐的运维监控工作
弹性伸缩困难

现在，有了函数计算 FC，一切变得如此简单！

函数计算 FC 已同步接入 Qwen3.5 本次开源的模型，提供企业级部署方案。基于 Serverless GPU 架构，你无需关心底层基础设施，只需专注于模型本身的应用与调试。

一键部署 Qwen3.5-397B-A178

准备一个 OSS Bucket，使用 https://functionai.console.aliyun.com/old/template-detail?tem... 这个白屏化工具，将 Qwen/Qwen3.5-397B-A17B 下载到 bucket 的一定目录中，比如 Qwen/Qwen3.5-397B-A17B。

a. 先将这个白屏化工具部署起来，等待部署成功

b. 编辑后端配置完毕以后，将 Qwen/Qwen3.5-397B-A17B 下载对应 bucket 中的指定目录，开始下载任务（注：模型很大，请耐心等待下载）

在 FunModel 的自定义部署（https://functionai.console.aliyun.com/fun-model/cn-hangzhou/c... ），选择好镜像以及计算资源，填写好对应的启动命令，既可以完成一键部署。

启动命令：

vllm serve /mnt/my-model-scope/models/Qwen/Qwen3.5-397B-A17B --served-model-name Qwen/Qwen3.5-397B-A17B --port 9000 --trust-remote-code --gpu-memory-utilization 0.9 --max-model-len 262144 --tensor-parallel-size 16 --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3