摊牌了,代码不是我自己写的

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 本文介绍了如何使用阿里云函数计算FC部署Qwen2.5开源大模型。Qwen2.5支持128K上下文长度和92种编程语言,通过Ollama托管和Open WebUI交互界面实现快速部署与高效调用。函数计算FC提供免运维环境,支持弹性扩容,开发者只需简单配置即可上线新功能。部署流程包括创建Ollama应用、配置Open WebUI及获取内网访问地址等步骤。应用体验部分展示了如何通过Open WebUI调用Qwen2.5进行多语言交流、解答数学题和文档总结等功能。此外,函数计算FC的自动扩缩容机制可根据请求量动态调整实例数量,提高资源利用率并降低成本。

一、引言

函数计算 FC 是一款免运维、高效开发的云服务工具,支持快速部署与弹性扩容,开发者可以通过简单的配置和代码上传,迅速上线新功能或修复问题,大大缩短了开发周期,让开发者专注于业务逻辑而无需担忧底层基础设施。


Qwen2.5 是阿里云推出的最新一代开源大模型,支持高达128K的上下文长度,覆盖92种编程语言,显著提升了代码生成和优化的能力。通过阿里云函数计算 FC提供的免运维的高效开发环境,Qwen2.5 可以快速部署和更新,无需考虑底层资源管理和运维问题,只专注于应用的创新和开发。


将Qwen2.5开源模型部署到函数计算 FC,还需要借助Ollama 和 Open WebUI 两个应用。Ollama 负责托管 Qwen2.5 模型,其中预置了 1.5B 参数规模的 Qwen2.5 模型,支持模型推理任务;Open WebUI 则为用户提供友好的交互界面,支持用户轻松调用和交互,实现高效的模型使用体验。


云端部署 Qwen2.5 模型核心优势:


  • 提供更高的灵活性:可根据用户自身业务需求灵活调整云服务资源配置,实现对高并发请求的有效支持。
  • 通过资源配置优化显著提升推理速度:可以通过调整实例规格、多 GPU 分布式部署、实施模型量化等措施提升推理速度。
  • 按业务量选择计费方式:计费方式灵活多样(包年包月、按量付费),在面对高频请求和大规模数据处理时,能够显著降低综合成本。
  • 避免数据泄露风险:企业可以实现对自身业务数据的完全控制,确保敏感信息的安全存储和处理。


本文将详细介绍如何利用函数计算 FC 部署 Qwen2.5 开源模型的流程。点击文末“阅读原文”,了解更多方案详情,开发更高效,智能更贴近。


二、操作教程

(一)整体架构


image.png


(二)基于 Ollama 部署 Qwen2.5 模型

将部署Ollama应用以提供模型服务。Ollama 是一个便捷的模型部署和管理工具,帮助开发者高效托管和服务化模型,便于快速集成 AI 能力。


1. 点击Ollama模板链接:

https://fcnext.console.aliyun.com/applications/create,访问创建Ollama应用页面。


2. 当前应用模板提供了Qwen2.5:1.5B模型。

image.png

  1. 其余配置项可不作修改,点击创建并部署默认环境按钮部署应用,应用部署成功后如下图所示。

image.png

(三)使用 Open WebUI 调用 Qwen2.5 模型

Open WebUI 是一个开源项目,提供了管理和操作模型的图形界面。

  1. Open WebUI模板链接[1],访问创建Open WebUI应用页面。
  2. 在高级配置 > 地域下拉列表中选择应用所属地域。注意所选地域与Ollama应用创建时所选的地域一致。

image.png

  1. 应用模板中提供了开启鉴权的选项,建议在生产环境开启,以增加安全性,防止未经授权的访问。

image.png

  1. Ollama接口地址填入Ollama应用的内网访问地址。

image.png

说明

Ollama应用内网访问地址获取方式:

打开函数计算 FC应用[2]页面,找到Ollama应用,点击应用名称进入应用详情。

image.png

在应用详情页找到函数资源,点击函数名称进入函数详情页。

image.png

鼠标移至HTTP 触发器,在展开的信息中复制内网访问地址。

image.png

5.其余配置项可不作修改,点击创建并部署默认环境按钮部署应用,应用部署成功后如下图所示。

image.png

6.Open WebUI应用部署完毕后,点击访问域名。

image.png


三、应用体验

(一)使用 Open WebUI 调用 Qwen2.5 模型

  1. 登录Open WebUI后,点击Select a model,在展开的下拉列表中选择Qwen2.5模型。如果在下拉列表中未显示可用的模型,请尝试刷新页面以更新列表。

说明:首次部署需要等待约5分钟,不断刷新会导致实例反复调用,为避免消耗更多资源请不要反复刷新。

image.png

  1. 可以在对话框中与系统进行交互,调用模型服务获得相应的响应。

image.png

  1. Qwen2.5 模型具备支持超过 29 种语言的能力,例如能够用法语进行自我介绍。

image.png

  1. 由于融入了领域专业专家模型,Qwen2.5 的知识广度和在编码与数学领域的能力都显著提升。我们可以提出一道数学题,Qwen2.5 能够给出正确的解答。

image.png

  1. 点击+图标,选择本地文档上传,可以使用我们提供的“百炼”手机详细参数.docx[3]。

image.png

  1. 针对当前文档撰写提示词“总结文档内容”。

image.png

  1. 可以看到Qwen2.5模型成功提炼出了文档的关键信息。

image.png

关于代码编写的结果,可以亲自去验证一下哦😄

(二)函数计算 FC 自动扩缩容机制

  1. 回到 Ollama 函数详情页,点击实例标签,如果当前实例列表为空,可以点击 image.png 图标刷新列表。

image.png

  1. 实例列表中可以看到 Ollama 函数实例的数量发生了变化。这是因为函数计算 FC 会根据函数调用量自动扩缩容,调用增加时创建实例,请求减少后若实例空闲超过一定时间(通常3-5分钟),则自动销毁以节约资源。这种动态扩缩容的机制不仅提高了资源利用率,还降低了运行成本,使开发者能够专注于业务逻辑,而无需担心底层基础设施的管理。

image.png

参考链接:

[1]https://fcnext.console.aliyun.com/applications/create?template=fc-open-webui&deployType=template-direct

[2]https://fcnext.console.aliyun.com/applications

[3]https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20240701/geijms/%E7%99%BE%E7%82%BC%E7%B3%BB%E5%88%97%E6%89%8B%E6%9C%BA%E4%BA%A7%E5%93%81%E4%BB%8B%E7%BB%8D.docx






来源  |  阿里云开发者公众号

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
算法
几行代码带来的巨大变化
几行代码带来的巨大变化
71 0
|
8月前
关于代码的思考
关于代码的思考
30 0
|
存储 安全 Java
写出漂亮代码的45个小技巧(下)
大家好,我是三友~~ 不知道大家有没有经历过维护一个已经离职的人的代码的痛苦,一个方法写老长,还有很多的if else ,根本无法阅读,更不知道代码背后的含义,最重要的是没有人可以问,此时只能心里默默地问候这个留坑的兄弟。。
写出漂亮代码的45个小技巧(下)
|
存储 设计模式 缓存
这45个小技巧,让你的代码突然又优雅了2
这45个小技巧,让你的代码突然又优雅了2
这45个小技巧,让你的代码突然又优雅了2
|
前端开发
代码为什么越写越乱?
这个问题往大的说是业务治理问题,往小了说是代码分拆。且看作者怎么写出好代码。
152 0
|
Web App开发 安全 编译器
如何保护你的代码 - Ollvm(一)
如何保护你的代码 - Ollvm(一)
如何保护你的代码 - Ollvm(一)
|
前端开发 C++
这几行代码,真的骚!
这几行代码,真的骚!
这几行代码,真的骚!
每天写出好代码的5个建议
译文出自:伯乐在线
657 0
|
Java 应用服务中间件 Spring
你也是这样写代码的吗?
想要学习Java高架构、分布式架构、高可扩展、高性能、高并发、性能优化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战学习架构师视频免费获取  架构群:835544715 点击链接加入群聊【JAVA高级架构】:https://jq.
961 0