Qwen2.5 的云端新体验,5 分钟完成极速部署

本文涉及的产品
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 将 Qwen2.5 模型部署于函数计算 FC,用户能依据业务需求调整资源配置,有效应对高并发场景,并通过优化资源配置,如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外,函数计算支持多样化 GPU 计费模式(按需计费、阶梯定价、极速模式),可根据业务需求调整,在面对高频请求和大规模数据处理时,能够显著降低综合成本。

Qwen2.5 是通义千问团队开发的大规模语言和多模态系列模型,以其长文本处理能力、专业知识集成、大规模数据集预训练以及多语言处理等优势,为用户提供了快速、准确的响应,成为企业智能化转型的有效工具。


将 Qwen2.5 模型部署于函数计算 FC,用户能依据业务需求调整资源配置,有效应对高并发场景,并通过优化资源配置,如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外,函数计算支持多样化 GPU 计费模式(按需计费、阶梯定价、极速模式),可根据业务需求调整,在面对高频请求和大规模数据处理时,能够显著降低综合成本。


有奖体验进行中!

使用函数计算 FC 一键部署 Qwen2.5 模型,完成 Ollama 和 Open WebUI 两个应用,两步赢蛇年对联!

活动时间:2024.12.23 00:00:00-2025.01.10 16:00:00

立即体验:https://developer.aliyun.com/topic/dec/fcqwen


适用客户


  • 对 AI 的深度理解、多领域知识集成、高效指令执行及多语言支持有高要求的客户
  • 期望通过可控的云服务资源配置,确保高效的模型推理和低延迟响应的企业


使用产品


  • 函数计算 FC


方案概览


本方案旨在介绍如何将 Qwen2.5 开源模型部署到函数计算 FC。通过函数计算 FC 部署 Ollama 和 Open WebUI 两个应用。Ollama 是一个负责托管 Qwen2.5 模型的应用程序,它为用户提供了多种参数规模的模型选择,并通过 Open WebUI 提供友好的交互界面,以便用户能够轻松地进行AI模型的部署和使用。方案提供的镜像预置了 1.5B、3B、7B 三种不同参数规模供用户选择,Open WebUI 则为用户提供友好的交互界面。


借助函数计算 FC,用户可以快速便捷地部署模型,而无需担心底层资源管理和运维问题,从而专注于应用的创新和开发。函数计算 FC 提供了免运维的高效开发环境,具备弹性伸缩和高可用性,并采用按量付费模式,有效降低资源闲置成本。


实际部署时,您可根据具体的资源规划调整部分配置,但最终的运行环境将与下图展示的架构相似。

image.png

本方案的技术架构包括以下云服务:
  • 函数计算 FC:全托管的 Serverless 计算服务,用于部署模型服务与 Web 应用。


部署模型


基于 Ollama 部署 Qwen2.5 模型

我们将部署 Ollama 应用以提供模型服务。Ollama 是一个便捷的模型部署和管理工具,帮助开发者高效托管和服务化模型,便于快速集成 AI 能力。


1. 点击 Ollama 模板链接[1],访问创建 Ollama 应用页面。

2. 当前应用模板提供了 Qwen2.5 模型 1.5B、3B 和 7B 三种不同参数规模的版本,可以在模型名称下拉列表中按需选择。

image.png

3. 其余配置项可不作修改,点击创建并部署默认环境按钮部署应用,应用部署成功后如下图所示。

image.png


Open WebUI 调用 Qwen2.5 模型

Open WebUI 是一个开源项目,提供了管理和操作模型的图形界面。


1. 点击 Open WebUI 模板链接[2],访问创建 Open WebUI 应用页面。

2. 在高级配置 > 地域下拉列表中选择应用所属地域。


警告:确保所选地域与 Ollama 应用创建时所选的地域一致。

image.png

3. 应用模板中提供了开启鉴权的选项,建议在生产环境开启,以增加安全性,防止未经授权的访问。

image.png

4. Ollama 接口地址填入 Ollama 应用的内网访问地址。

image.png

说明:Ollama 应用内网访问地址获取方式:

a. 打开函数计算 FC 应用[3]页面,找到 Ollama 应用,点击应用名称进入应用详情。

image.png

b. 在应用详情页找到函数资源,点击函数名称进入函数详情页。

image.png

c. 鼠标移至 HTTP 触发器,在展开的信息中复制内网访问地址

image.png

5. 其余配置项可不作修改,点击创建并部署默认环境按钮部署应用,应用部署成功后如下图所示。

image.png

6. Open WebUI 应用部署完毕后,点击访问域名

image.png

7. 首次打开需要完成实例的创建和模型的部署,请等待 3-5 分钟。


应用体验


一、使用 Open WebUI 调用 Qwen2.5 模型

1. 登录 Open WebUI 后,点击 Select a model,在展开的下拉列表中选择 Qwen2.5 模型。如果在下拉列表中未显示可用的模型,请尝试刷新页面以更新列表。

image.png

2. 可以在对话框中与系统进行交互,调用模型服务获得相应的响应。

image.png

3. Qwen2.5 模型具备支持超过 29 种语言的能力,例如能够用法语进行自我介绍。

image.png

4. 由于融入了领域专业专家模型,Qwen2.5 的知识广度和在编码与数学领域的能力都显著提升。我们可以提出一道数学题,Qwen2.5 能够给出正确的解答。

image.png

5. 点击 image.png 图标,选择本地文档上传,可以使用我们提供的“百炼”手机详细参数.docx[4]

image.png

6. 针对当前文档撰写提示词“总结文档内容”。

image.png

7. 可以看到 Qwen2.5 模型成功提炼出了文档的关键信息。

image.png

说明:Open WebUI 中文设置:

1. 点击右上角 image.png 图标,在展开的下拉列表中选择 Settings

image.png

2. 在 Settings 弹窗中,选择 General > Language

image.png

3. 在展开的下拉列表中找到并点击 Chinese(简体中文)

image.png

4. 页面会自动刷新,此时 Open WebUI 的界面语言已切换为简体中文,点击保存按钮后关闭弹窗。

image.png

二、函数计算 FC 自动扩缩容机制

1. 回到 Ollama 函数详情页,点击实例标签,如果当前实例列表为空,可以点击 image.png 图标刷新列表。

image.png

2. 实例列表中可以看到 Ollama 函数实例的数量发生了变化。这是因为函数计算 FC 会根据函数调用量自动扩缩容,调用增加时创建实例,请求减少后若实例空闲超过一定时间(通常 3-5 分钟),则自动销毁以节约资源。这种动态扩缩容的机制不仅提高了资源利用率,还降低了运行成本,使开发者能够专注于业务逻辑,而无需担心底层基础设施的管理。

image.png


相关链接:

[1] Ollama 模板链接

https://fcnext.console.aliyun.com/applications/create?template=ollama-qwen2_5&deployType=template-direct&from=solution

[2] Open WebUI 模板链接

https://fcnext.console.aliyun.com/applications/create?template=fc-open-webui&deployType=template-direct

[3] 函数计算 FC 应用

https://fcnext.console.aliyun.com/applications

[4] “百炼”手机详细参数.docx

https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20240701/geijms/%E7%99%BE%E7%82%BC%E7%B3%BB%E5%88%97%E6%89%8B%E6%9C%BA%E4%BA%A7%E5%93%81%E4%BB%8B%E7%BB%8D.docx


相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
7天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150228 10
|
4天前
|
供应链 监控 安全
|
15天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201928 14
对话 | ECS如何构筑企业上云的第一道安全防线
|
6天前
|
SQL 安全 前端开发
预编译为什么能防止SQL注入?
SQL注入是Web应用中常见的安全威胁,攻击者通过构造恶意输入执行未授权的SQL命令。预编译语句(Prepared Statements)是一种有效防御手段,它将SQL代码与数据分离,确保用户输入不会被解释为SQL代码的一部分。本文详细介绍了SQL注入的危害、预编译语句的工作机制,并结合实际案例和多语言代码示例,展示了如何使用预编译语句防止SQL注入,强调了其在提升安全性和性能方面的重要性。
|
10天前
|
搜索推荐 物联网 PyTorch
Qwen2.5-7B-Instruct Lora 微调
本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。
421 34
Qwen2.5-7B-Instruct Lora 微调
|
1月前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
9955 29
|
3天前
|
人工智能 算法 搜索推荐
阿里云百炼xWaytoAGI共学课开课:手把手学AI,大咖带你从零搭建AI应用
阿里云百炼xWaytoAGI共学课开课啦。大咖带你从零搭建AI应用,玩转阿里云百炼大模型平台。3天课程,涵盖企业级文本知识库案例、多模态交互应用实操等,适合有开发经验的企业或独立开发者。直播时间:2025年1月7日-9日 20:00,地点:阿里云/WaytoAGI微信视频号。参与课程可赢取定制保温杯、雨伞及磁吸充电宝等奖品。欢迎加入钉钉共学群(群号:101765012406),与百万开发者共学、共享、共实践!
|
3天前
|
SQL 存储 Apache
基于 Flink 进行增量批计算的探索与实践
本文整理自阿里云高级技术专家、Apache Flink PMC朱翥老师在Flink Forward Asia 2024的分享,内容分为三部分:背景介绍、工作介绍和总结展望。首先介绍了增量计算的定义及其与批计算、流计算的区别,阐述了增量计算的优势及典型需求场景,并解释了为何选择Flink进行增量计算。其次,详细描述了当前的工作进展,包括增量计算流程、执行计划生成、控制消费数据量级及执行进度记录恢复等关键技术点。最后,展示了增量计算的简单示例、性能测评结果,并对未来工作进行了规划。
254 5
基于 Flink 进行增量批计算的探索与实践
|
3天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。