vLLM + SGLang + Ollama 自动适配!阿里云 Qwen3 部署智能选引擎

简介: 阿里云Qwen3正式开源8款混合推理模型(含2款MoE、6款Dense),支持119种语言,适配vLLM/SGLang/Ollama。依托函数计算FC与FunctionAI平台,提供模型服务与应用模板两种Serverless部署方式,最低GPU配置即可快速体验。

vLLM + SGLang + Ollama 自动适配!阿里云 Qwen3 部署智能选引擎,Qwen3 正式发布并全部开源8款混合推理模型。凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度和广泛的用户基础,本篇文档将以通义千问3-8B模型为例演示部署流程,欢迎您进行体验。详细参考阿里云通义千问大模型官方页面:https://www.aliyun.com/product/tongyi 如下图:

千问大模型.png

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数)和Qwen3-30B-A3B(300亿总参数、30亿激活参数),六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。这些模型在代码、数学、通用能力等基准测试中表现出极具竞争力的结果。


目前阿里云推出百炼Coding Plan,费用首月7.9元起,申请:https://www.aliyun.com/product/bailian

codingplan-2.jpg

Qwen3 支持思考模式和非思考模式两种模式,适用于不同类型的问题,支持119种语言和方言。

依托于阿里云函数计算FC算力,Serverless+ AI开发平台FunctionAI现已提供模型服务、应用模板两种部署方式辅助您部署Qwen3系列模型。完成模型部署后,您即可与模型进行对话体验;或以 API 形式进行调用,接入 AI 应用中,欢迎您立即体验

支持的模型列表

部署方式说明:

  • vLLM:大模型加速推理框架,优化内存利用率和吞吐量,适合高并发场景。
  • SGLang:支持复杂的LLM Programs,如多轮对话、规划、工具调用和结构化输出等,并通过协同设计前端语言和后端运行时,提升多GPU节点的灵活性和性能。

模型

部署方式

最低配置

通义千问3-0.6B

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-0.6B-FP8

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-1.7B

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-1.7B-FP8

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-4B

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-4B-FP8

vLLM/SGLang/Ollama

GPU 进阶型

通义千问3-8B

vLLM/SGLang/Ollama

GPU 性能型

通义千问3-8B-FP8

vLLM/SGLang/Ollama

GPU 性能型

通义千问3-14B

vLLM/SGLang/Ollama

GPU 性能型

通义千问3-14B-FP8

vLLM/SGLang/Ollama

GPU 性能型

计费说明

本教程所涉及的模型服务其本质是在函数计算中创建的GPU函数,函数运行使用的资源按照函数规格乘以执行时长进行计量,如果无请求调用,则只收取极速模式下预置的快照费用。建议您领取函数计算的试用额度抵扣资源消耗,超出试用额度的部分将自动转为按量计费,更多计费详情,请参见计费概述


函数计算免费额度领取:https://free.aliyun.com/    如下图,搜索函数计算”如下图:

函数计算免费额度.png


重要

本项目部署完成,会预置一个启动快照,即使您在不使用的情况下,也会存在快照费用,请您根据需求情况及时删除项目,以免产生预期外的费用。

应用模板部署

1. 创建项目

登录函数计算3.0控制台,在左侧导航栏单击Function AI,在Funciton AI页面导航栏,选择项目,然后单击创建项目,选择基于模板创建

说明

当左上角显示函数计算FC 3.0时,表示当前控制台为3.0控制台。

2. 基于模板部署项目

  1. 在搜索栏输入Qwen3进行搜索,单击基于 Qwen3 构建AI 聊天助手,进入模板详情页,单击立即部署


  2. 选择地域,单击部署项目,在项目资源预览对话框中,您可以看到相关的计费项,详情请见计费说明。单击确认部署,部署过程大约持续 10 分钟左右,状态显示已部署表示部署成功。
    说明
    如果您在测试调用的过程中遇到部署异常或模型拉取失败,可能是当前地域的GPU显卡资源不足,建议您更换地域进行重试。


3. 验证应用

部署完毕后,点击Open-WebUI服务,单击自定义域名的公网访问地址进行访问。

删除项目

  1. 进入项目详情 > 点击删除,会进入到删除确认对话框。

  2. 您可以看到要删除的资源。默认情况下,Function AI会删除项目下的所有服务。如果您希望保留资源,可以取消勾选指定的服务,删除项目时只会删除勾选的服务。

  3. 勾选我已知晓:删除该项目及选中的服务将立刻中断其所服务的线上业务,并且不可恢复,同时将彻底删除其所依赖的云产品资源,然后单击确定删除
相关文章
|
2月前
|
API Docker 异构计算
大模型应用:大模型本地化部署与API调用:打包迁移到服务器的多种方式实践.47
本文详解大模型从本地运行到云端API服务的全链路部署:涵盖硬件要求(GPU/CPU/内存)、软件环境(Python/FastAPI/Transformers)、模型选型(Qwen/ChatGLM等),并提供脚本部署、EXE打包(PyInstaller)和Docker容器化三种方案,支持局域网调用与接口文档自动生成,助力零基础用户快速实现“开箱即用”的稳定API服务。
1569 25
|
2月前
|
人工智能 前端开发 Serverless
不用写一行代码!阿里云上线 Qwen3 一键部署,秒开大模型对话界面
通义千问Qwen3正式开源8款混合推理模型,含2款MoE(235B/30B)和6款Dense(0.6B–32B),支持119种语言、思考/非思考双模式,在代码、数学等基准表现优异。依托阿里云函数计算,提供vLLM/SGLang/Ollama等多种部署方式,开箱即用。(239字)
592 23
|
2月前
|
人工智能 前端开发 Serverless
10 分钟部署 Qwen3!阿里云 FunctionAI 模板实测,成本低至 ¥0.5/小时
通义千问Qwen3正式开源8款混合推理模型,含2款MoE(如Qwen3-235B-A22B)和6款Dense模型(从0.6B到32B),支持119种语言、思考/非思考双模式,在代码、数学等基准测试中表现优异。依托阿里云函数计算FC与FunctionAI平台,提供vLLM/SGLang/Ollama等多种部署方式,开箱即用。
980 30
|
2月前
|
数据采集 存储 机器学习/深度学习
大模型应用:大模型训练数据治理:噪声过滤与高质量中文语料构建实践.40
本文系统阐述中文大模型训练数据治理的核心方法,涵盖噪声分类(内容/格式/偏见/纯净性)、高质量语料四大标准(准确性、全面性、纯净性、新颖性)及五步闭环流程,并通过规则与模型驱动的实践案例,验证数据质量对模型性能的显著影响。
498 3
|
2月前
|
缓存 项目管理 开发工具
UV实战教程,我啥要从Anaconda切换到uv来管理包?
本文对比Anaconda“手动挡”与uv“全自动挡”环境管理:uv以“项目即环境”为核心,支持`uv init`一键初始化、自动下载Python、智能依赖管理(`uv add/sync/run`)及PyCharm无缝对接,大幅提升Python开发效率与协作体验。(239字)
998 11
UV实战教程,我啥要从Anaconda切换到uv来管理包?
|
3月前
|
机器学习/深度学习 测试技术 API
Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力
通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)
7871 23
|
3月前
|
机器学习/深度学习 自然语言处理 API
Qwen3.5:迈向原生多模态智能体
除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。
4360 4
Qwen3.5:迈向原生多模态智能体
|
2月前
|
人工智能 前端开发 Linux
保姆级Ai零代码创业教程:OpenClaw(Clawdbot)全平台部署(阿里云/Win11/Mac/Linux)+SaaS封装+避坑指南
“有技术想法却不会编程”“想做副业却没精力维护”“手里有资源却不知道怎么变现”——这是很多创业者与副业追求者的共同困境。2026年,开源AI自动化框架OpenClaw的爆发,让“零代码搭建SaaS工具”成为现实。参考文章中的成功案例证明,通过OpenClaw封装AI能力,将复杂的技术服务转化为“一键使用”的网页工具,就能实现日入200美金的稳定订阅收入,且全程自动化运营,无需投入大量人力成本。
1196 16
|
2月前
|
JavaScript Linux API
【OpenClaw保姆级教程】阿里云/Win11/MacOS/Linux部署+4个核心Skill搞定80%工作
“花两天部署好OpenClaw,结果只会聊天?让它搜竞品数据说‘无法联网’,让它整理Excel说‘没有功能’”——这是2026年无数OpenClaw用户的共同吐槽。正如参考文章中跨境电商从业者的经历,很多人误以为部署完OpenClaw就万事大吉,却忽略了核心:OpenClaw本身只是“空壳框架”,真正让它从“废物”变“神器”的,是Skills(技能插件)。
962 19
|
1月前
|
存储 自然语言处理 算法
大模型应用:基于千问大模型 + 图算法:可追溯知识图谱问答系统构建.83
本文介绍“图算法+大模型”双引擎智能问答方案:用PageRank、最短路径等图算法处理关系推理与知识验证,由千问大模型负责自然语言理解与生成,实现可信、可溯源、强推理的高可靠问答,破解幻觉、推理弱、不可溯三大难题。
402 7

热门文章

最新文章