零配置部署顶级模型!函数计算一键解锁 Qwen3.5

简介: 函数计算FunModel平台支持云上一键部署Qwen3.5-397B-A17B,5分钟完成上线。依托Serverless+GPU,实现弹性扩缩容,轻松实现高性能、低成本AI应用落地。

作者:西流


就在最近,大模型圈再次迎来重磅炸弹!阿里巴巴开源了全新一代大模型——千问 Qwen3.5-397B-A17B,直接登顶全球最强开源模型宝座。


面对如此强大的模型,开发者们最关心的问题莫过于: “这么强的模型,部署起来会不会很麻烦?”


今天,我们就为大家带来一个 “神器级”解决方案——通过函数计算 FC 实现一键部署 Qwen3.5,让顶级模型的计算力触手可及!


模型介绍

这次开源的 Qwen3.5-397B-A17B 可不是普通的模型升级,它在架构和性能上都实现了质的飞跃:

  • 性能超过万亿参数的 Qwen3-Max 模型,是目前全球最强开源模型,总参数 3970 亿,但激活参数仅 170 亿。采用创新的混合架构(线性注意力 Gated Delta Networks + 稀疏混合专家 MoE),在保持能力的同时优化了速度与成本。
  • 成本降低:部署显存占用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至 19 倍!
  • 全能选手 :作为原生视觉 - 语言模型,在推理、编程、智能体能力与多模态理解上表现优异。语言支持从 119 种扩展至 201 种,全球通用。


函数计算解决方案

传统部署大模型,你通常需要面对:

  • 复杂的 GPU 环境配置
  • 繁琐的运维监控工作
  • 弹性伸缩困难


现在,有了函数计算 FC,一切变得如此简单!


函数计算 FC 已同步接入 Qwen3.5 本次开源的模型,提供企业级部署方案。基于 Serverless GPU 架构,你无需关心底层基础设施,只需专注于模型本身的应用与调试。


一键部署 Qwen3.5-397B-A178

  1. 准备一个 OSS Bucket,使用 https://functionai.console.aliyun.com/old/template-detail?tem... 这个白屏化工具,将 Qwen/Qwen3.5-397B-A17B 下载到 bucket 的一定目录中,比如 Qwen/Qwen3.5-397B-A17B。

a. 先将这个白屏化工具部署起来,等待部署成功

b. 编辑后端配置完毕以后,将 Qwen/Qwen3.5-397B-A17B 下载对应 bucket 中的指定目录,开始下载任务(注:模型很大,请耐心等待下载)

  1. 在 FunModel 的自定义部署(https://functionai.console.aliyun.com/fun-model/cn-hangzhou/c... ),选择好镜像以及计算资源,填写好对应的启动命令,既可以完成一键部署。

启动命令:

vllm serve /mnt/my-model-scope/models/Qwen/Qwen3.5-397B-A17B --served-model-name Qwen/Qwen3.5-397B-A17B --port 9000 --trust-remote-code --gpu-memory-utilization 0.9 --max-model-len 262144 --tensor-parallel-size 16 --enable-auto-tool-choice --tool-call-parser qwen3_coder --reasoning-parser qwen3
  1. 耐心等待部署,部署成功后,即可以进行推理服务的调试。


qwen3.5 模型市场

更多 qwen3.5 模型一键部署方案请参考。(模型持续补充中)


总结

维度 传统方案 FunModel
部署时间 以天计 5分钟
技术门槛
运维以及迭代成本


依托 Serverless + GPU,天然提供了简单,轻量,0 门槛的模型集成方案,给个人开发者良好的玩转模型的体验,也让企业级开发者快速高效的部署、运维和迭代模型。


在阿里云函数计算,开发者可以做到:

  • 模型的快速部署上线:从原来的以周为单位的模型接入周期降低到 5 分钟,0 开发,无排期。
  • 一键扩缩容,让运维不再是负担:多种扩缩容策略高度适配业务流量,实现“无痛运维”。


在 AI 的时代浪潮下,模型作为 AI 的载体必然会不断迭代,开发者对模型部署的需求也会日益增多,函数计算 FC 为模型部署和集成提供新范式,也会朝着“让人人成为开发者”的目标演进下去。


更多内容请参考:

[1] FunModel 快速入门

https://fun-model-docs.devsapp.net/getting-started/

[2] FunModel 自定义部署

https://fun-model-docs.devsapp.net/user-guide/custom-model-deployment/

相关实践学习
函数计算部署PuLID for FLUX人像写真实现智能换颜效果
只需一张图片,生成程序员专属写真!本次实验在函数计算中内置PuLID for FLUX,您可以通过函数计算+Serverless应用中心一键部署Flux模型,快速体验超写实图像生成的魅力。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
20天前
|
运维 监控 安全
你的 OpenClaw 真的在受控运行吗?
本文基于 OpenClaw 与阿里云 SLS,将 Session 审计日志、应用日志与 OTEL 遥测统一汇入,搭建「日志 + 指标 + 链路」可观测体系,实现行为审计、运维观测与安全审计闭环,回答「Agent 是否在受控运行」。
223 12
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus,全球最强开源大模型:3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与视觉编程;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
|
3月前
|
人工智能 运维 监控
进阶指南:BrowserUse + AgentRun Sandbox 最佳实践
本文将深入讲解 BrowserUse 框架集成、提供类 Manus Agent 的代码示例、Sandbox 高级生命周期管理、性能优化与生产部署策略。涵盖连接池设计、安全控制、可观测性建设及成本优化方案,助力构建高效、稳定、可扩展的 AI 浏览器自动化系统。
729 47
|
25天前
|
人工智能 Ubuntu API
零门槛组建AI协作团队:OpenClaw多Agent配置+阿里云、本地部署+大模型对接完整手册
OpenClaw的多Agent协作功能,让用户能够快速搭建分工明确、协同高效的AI虚拟团队,每个Agent拥有独立角色、工作空间与权限,可通过预设规则处理专属任务,并实现跨Agent消息传递与协作。本文基于2026年最新版本,详细拆解多Agent团队搭建的核心步骤——Agent创建、属性配置、路由绑定、通信启用,同时提供阿里云及本地多系统部署流程、阿里云百炼免费大模型配置,所有命令可直接复制执行,助力用户轻松实现从单一智能体到多角色协作团队的升级。
1810 7
|
17天前
|
人工智能 安全 机器人
阿里云无影云电脑部署OpenClaw图文教程:QQ集成+千问Qwen3.6-Plus配置+新手避坑指南
2026年,OpenClaw(原Clawdbot)作为开源AI代理自动化框架的标杆产品,凭借轻量化部署、跨平台兼容、大模型生态完善、即时通讯集成便捷的核心优势,成为个人与团队搭建专属智能助手的首选方案。阿里云无影云电脑以云端桌面、随时随地访问、环境预置、安全稳定的特性,为OpenClaw提供7×24小时不间断运行的理想环境,彻底解决本地部署断电、断网、设备性能不足的痛点。搭配QQ深度集成,用户可通过QQ单聊、群聊随时随地与AI助手交互;配合阿里云千问Qwen3.6-Plus高性能大模型,实现智能对话、代码生成、任务自动化、文档处理、信息检索等全场景能力。本文全程提供可直接复制的代码命令,从阿里
384 10
|
3月前
|
人工智能 缓存 Shell
Qoder 发布首个自进化的智能体:看 Quest 如何重构了 Quest
Quest 是一款实现真正自主编程的AI代理,通过Agentic上下文管理、精简Bash工具链、Spec→Coding→Verify闭环及动态Skills系统,让AI端到端交付可运行产物。它不依赖人工调试,支持自进化与多模型协同,专为未来大模型而设计。(239字)
Qoder 发布首个自进化的智能体:看 Quest 如何重构了 Quest
|
30天前
|
SQL Java API
Agent 越用越聪明?AgentScope Java 在线训练插件来了!
使用AgentScope Java + Trinity-RFT 在线训练优化你的Agent,让你的Agent边运行边进化。
724 19
|
1月前
|
Arthas 人工智能 Java
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent
Arthas Agent 是基于阿里开源Java诊断工具Arthas的AI智能助手,支持自然语言提问,自动匹配排障技能、生成安全可控命令、循证推进并输出结构化报告,大幅降低线上问题定位门槛。
1123 64
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent
|
12天前
|
缓存 运维 监控
当你的 Agent 会“多轮思考”,Trace 却还停留在单轮:阿里云 CMS OpenClaw 可观测插件升级
阿里云 OpenClaw 可观测插件新版本上线!解决行业通病,还原完整链路信息:多轮 LLM 分段还原真实决策链路、STEP Span 让"第几轮"可观测、并发断链/串链显著修复、AGENT 指标稳定可量化。从"有图可看"升级到"支撑决策",排障、成本治理、并发验证全面提效。