阿里云QwQ-32B推理模型部署教程:基于函数计算FC的Function AI,新手0代码成功经验分享

简介: 阿里云QwQ-32B推理模型正式开源!性能媲美全球最强开源模型,在数学、编程等基准测试中超越DeepSeek-R1-671B。本教程基于函数计算FC与Function AI,提供零代码“应用模板”一键部署方案,支持Web对话与API调用,新手10分钟即可上手体验。

阿里云QwQ-32B推理模型部署教程:基于函数计算FC的Function AI,新手0代码成功经验分享,QwQ-32B推理模型正式发布并开源,凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度。基于阿里云函数计算 FC提供算力,Function AI现已提供模型服务、应用模板两种部署方式辅助您部署QwQ 32B系列模型。您选择一键部署应用模板与模型进行对话或以API形式调用模型,接入AI应用中。欢迎您立即体验QwQ-32B。本文部署工具函数计算FC:https://www.aliyun.com/product/fc  如下图:

阿里云函数计算FC.png

QwQ-32B更小尺寸,性能比肩全球最强开源推理模型

QwQ-32B在一系列基准测试中进行了评估,包括数学推理、编程和通用能力。以下结果展示了QwQ-32B与其他领先模型的性能对比,包括 DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、OpenAI-o1-mini以及原始的DeepSeek-R1-671B。

在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1-671B相当,远胜于OpenAI-o1-mini及相同尺寸的R1蒸馏模型。在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1-671B。

前置准备

本教程在函数计算中创建的GPU函数,函数运行使用的资源按照函数规格乘以执行时长进行计量,如果无请求调用,则只收取浅休眠(原闲置)预留模式下预置的快照费用,Function AI中的极速模式通过预置实例快照实现毫秒级响应,其技术原理对应函数计算的浅休眠(原闲置)预留模式,适用于需要快速冷启动的场景。建议您领取函数计算的试用额度抵扣资源消耗,超出试用额度的部分将自动转为按量计费,更多计费详情,请参见计费概述

方式一:应用模板部署

1. 创建项目

登录函数计算3.0控制台,在左侧导航栏单击Function AI,在Funciton AI页面导航栏,选择项目,然后单击创建项目,选择基于模板创建

说明

当左上角显示函数计算FC 3.0时,表示当前控制台为3.0控制台。

2. 部署模板

  1. 在搜索栏输入QWQ进行搜索,单击基于Qwen-QwQ 推理模型构建AI聊天助手,进入模板详情页,单击立即部署


  2. 选择地域,目前支持北京、上海、杭州,单击部署项目,在项目资源预览对话框中,您可以看到相关的计费项,详情请见计费涉及的产品。单击确认部署,部署过程大约持续 10 分钟左右,状态显示已部署表示部署成功。说明
  • 选择地域时,一般是就近选择地域信息,如果已经开启了NAS文件系统,选择手动配置模型存储时,请选择和文件系统相同的地域。
  • 如果您在测试调用的过程中遇到部署异常或模型拉取失败,可能是当前地域的GPU显卡资源不足,建议您更换地域进行重试。


3. 验证应用

部署完毕后,点击Open-WebUI服务,在访问地址内找到公网访问单击访问。在OpenWebUI界面体验QwQ模型进行对话。


目录
相关文章
|
1月前
|
监控 Linux 网络安全
阿里云轻量应用服务器安装宝塔面板教程,基于宝塔Linux或Windows面板
本文详解阿里云轻量应用服务器一键部署宝塔Linux面板(9.2.0阿里云专享版)全流程:选BT-Panel应用镜像,3步完成创建、登录与激活;享两大特权——免费使用异常监控推送/堡塔APP,及官方付费软件额外折扣。新手友好,图文清晰。(239字)
358 7
|
1月前
|
Linux 虚拟化 iOS开发
macOS Tahoe 26.3.1 (25D2128) 正式版发布,ISO、IPSW、PKG 下载
macOS Tahoe 26.3.1 (25D2128) 正式版发布,ISO、IPSW、PKG 下载
992 1
macOS Tahoe 26.3.1 (25D2128) 正式版发布,ISO、IPSW、PKG 下载
|
1月前
|
缓存 Java 开发者
吃透 Spring Bean 生命周期:从源码底层到实战落地
本文深度解析Spring 6.2.3 Bean生命周期,涵盖BeanDefinition注册、实例化、属性填充、Aware回调、BeanPostProcessor前后置处理、初始化(@PostConstruct/InitializingBean/init-method)、AOP代理、单例缓存及销毁全流程,结合源码、实战示例与生产问题排查,助你彻底掌握IoC核心机制。
568 3
|
1月前
|
人工智能 自然语言处理 Linux
OpenClaw(Clawdbot)阿里云/本地部署+OpenClaw ClawHub上12800+Skill中下载量TOP15精选分享,踩坑指南
事实上,OpenClaw的核心价值在于Skill生态的“精准适配”——80%的技能实用性较低,真正值得安装的不过十几个,且已被社区下载数据验证。本文将以ClawHub真实下载量为依据,按“底层能力+核心工具+身份专属”三层逻辑,精选高价值Skill,同步提供2026年新手零基础的阿里云与本地部署流程,所有代码命令可直接复制执行,全程无营销词汇,助力不同身份用户精准选型、高效落地。
1993 4
|
1月前
|
存储 缓存 Linux
ffmpeg.wasm 合并 TS 视频教程:浏览器端视频处理实践
一种基于ffmpeg.wasm的浏览器端TS视频合并方案,通过将FFmpeg编译为WebAssembly,实现了在浏览器本地直接处理TS文件的功能。文章详细阐述了实现思路:加载wasm核心、上传TS文件、生成合并列表、执行FFmpeg命令并导出MP4。
ffmpeg.wasm 合并 TS 视频教程:浏览器端视频处理实践
|
1月前
|
弹性计算 数据安全/隐私保护
阿里云怎样部署我的世界(MC)服务器?2026年最新攻略来了!
阿里云怎样部署我的世界(MC)服务器?阿里云推出了我的世界(MC)一键部署方案,无需专业技术,新手小白也能快速部署联机游戏服务器!
627 10
|
1月前
|
SQL 前端开发 JavaScript
PHP 的异步编程 该怎么选择
本文深入解析PHP异步编程演进:从4.3版Streams非阻塞I/O,到5.5生成器模拟协程,再到8.1原生Fiber;对比EventLoop与Promise(ReactPHP/Amp)方案,剖析回调地狱破解之道,并给出选型建议——重链式逻辑选ReactPHP,重同步体验选Amp+Revolt事件循环。(239字)
386 163
|
1月前
|
人工智能 弹性计算 自然语言处理
阿里云怎样部署OpenClaw?2026年保姆级攻略来了!
OpenClaw怎样部署?阿里云推出了OpenClaw快速部署方案,零基础也能轻松上手,仅需三步即可拥有专属AI助理!
656 8
|
1月前
|
SQL 人工智能 Java
Java开发效率提升200%的AI工具,我每天都在用
飞哥,8年Java后端老兵,亲历SSH到微服务演进。2026年,他依托飞算JavaAI重构开发流:需求分析→AI生成→人工优化→智能测试,编码效率提升200%,测试用例编写提速65%,文档零耗时。AI不是替代,而是让开发者回归架构与创造。(239字)