数据缓存系列分享(六):通义千问Qwen-14B大模型快速体验

本文涉及的产品
云服务器ECS,u1 2核4GB 1个月
云服务器 ECS,u1 4核16GB 1个月
云服务器 ECS,u1 4核8GB 1个月
简介: 阿里达摩院近期对通义千问大模型 Qwen-14B 进行了开源(之前开源的是Qwen-7B模型),目前在ModelScope和HuggingFace上均可直接下载。关于Qwen-7B的搭建可以参考我们之前的文章:数据缓存系列分享(五):开源大语言模型通义千问快速体验版,本文将使用一样的方式打开Qwen-14B,快速体验一下。

背景

阿里达摩院近期对通义千问大模型 Qwen-14B进行了开源(之前开源的是Qwen-7B模型),目前在ModelScope和HuggingFace上均可直接下载。关于Qwen-7B的搭建可以参考我们之前的文章:数据缓存系列分享(四):开源大语言模型通义千问快速体验版,本文将使用一样的方式打开Qwen-14B,快速体验一下。

注:除了模型缓存创建稍有不同,其他流程都是完全相同,无需任何变化。

创建千问模型缓存

进入 Qwen-14B 主页,找到模型信息:

cf811e29-7adb-4125-904c-87ba52cd9d14.png

然后进入ECI数据缓存 控制台,选择URL类型的数据源,参数参考如下:

repoSource: ModelScope/Model

repoId: qwen/Qwen-14B-Chat

revision:v1.0.4

309fb136-3e80-42ac-8698-f80d47174ede.png

所有ModelScope、HuggingFace上标准模型缓存创建流程都是类似,只需找到对应的repoId即可。

关于数据缓存更多详情可以参考:https://help.aliyun.com/zh/eci/user-guide/data-caching-overview

部署千问webui

因为只需替换模型即可,所以应用部署跟7B完全一致,可以直接参考我们之前的文章,数据缓存系列分享(四):开源大语言模型通义千问快速体验版包含k8s api、openApi、控制台等多种部署方式。如果已经熟悉基本流程,文章后续可以跳过。

本文将主要介绍控制台部署千问的方式,进入ECI售卖页

1、选择GPU规格

14B对显存要求更高,根据官方测评数据,40+GB显存会比较安全,我们直接用了60GB

1573d1ff-9831-4195-b67d-1cf79f87d656.png

2、选择千问的容器镜像

容器配置 -> 选择容器镜像 -> 常用镜像

如果是非杭州地域,直接填入镜像,效果是一样的。

registry.cn-hangzhou.aliyuncs.com/eci_open/qwen-webui

版本:1.0.0

4143e6ae-7939-4191-b4d3-112ea5c6d608.png

3、挂载模型缓存进容器

使用前面刚创建好的模型缓存,挂载进容器的/data/model/目录

bucket: test

path: /model/test/qwen-14b

105eb966-c113-4e98-84ae-feee453a2562.png

4、打开公网(如果通过公网地址访问webui)

a44ad9f6-4c52-44ee-87ec-fc222a9b422f.png




至此,通义千问就已经部署完成,通过ip:8888就可以访问界面了:

7258feb8-1452-4586-8375-ca0e315ae92c.png

忽略logo,因为我是直接用之前制作好的7B的容器镜像。

注:

1、确保安全组放开了8888端口,如果想换端口,覆盖容器的启动命令即可,比如:

python Qwen-7B/web_demo.py --server_port xxx

2、目前控制台还不支持打开缓存burst load方式,模型加载速度会略慢一些,耐心等待。

体验

0efaf7da-8e60-48db-9a1c-255c722add40.png733c0e30-faf8-4970-90ef-fee5a7466195.png




总结

本文基于数据缓存系列分享(四):开源大语言模型通义千问快速体验版制作的webui镜像无需做任何修改,就可以直接替换成14B模型,也是我们一直在主推的应用与模型解耦的方式。

对于公共开源大模型,我们可以利用公共缓存的优势,实现一次缓存,全网加速,节省所有用户下载、打包、上传的时间,而且可以做到大规模秒级分发,应用启动时按需载入内存即可,尤其是弹性场景非常稳定、便捷。



附录

数据缓存系列分享(一):打开大模型应用的另一种方式

数据缓存系列分享(二):23秒完成从零开始搭建StableDiffusion

数据缓存系列分享(三):通过 StableDiffusion 扩展插件实现网红爆款文字光影图

数据缓存系列分享(四):开源大语言模型通义千问快速体验

数据缓存系列分享(五):零代码搭建妙鸭相机

数据缓存系列分享(六):通义千问Qwen-14B大模型快速体验

相关实践学习
利用大模型大规模分发技术,实现AIGC在线应用秒级弹性
通过ECI的数据缓存技术实现大模型的快速分发,将模型与应用解耦,敏捷部署,实现秒级在线弹性启动。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
19天前
|
存储 缓存 测试技术
有效使用缓存时需要缓存动态数据吗?
【6月更文挑战第7天】本文探讨了如何有效地缓存数据以提升应用性能。关键在于选择合适的数据进行缓存和适时缓存。缓存不应被视为永久存储,应同时维护原始数据存储。
75 2
有效使用缓存时需要缓存动态数据吗?
|
21天前
|
缓存 NoSQL 中间件
应对数据库不断膨胀的数据:缓存和队列中间件
【6月更文挑战第5天】该文探讨了优化数据库使用以提升应用系统性能的策略。文中建议利用Redis缓存和MQ消息队列作为辅助工具,以进一步优化性能和减少资源消耗。
21 2
应对数据库不断膨胀的数据:缓存和队列中间件
|
5天前
|
缓存 安全 算法
Go 中使用 map 实现高效的数据缓存
Go 中使用 map 实现高效的数据缓存
|
15天前
|
自然语言处理 Java 测试技术
使用PostMan请求阿里云通义千问大模型
本文介绍如果通过postman调用阿里云通义千问API,然后介绍如果使用多语言集成,最后介绍了快速使用postman压测创建的API请求。
313 1
如何快速体验通义千问全系列模型能力
体验通义千问全系列模型能力,需在阿里云开通百炼服务。访问阿里云百炼控制台的“模型广场”,可选择包括通义系列在内的多种模型。按照指南进行训练、部署和评测。详情参阅官方文档。
|
1月前
|
人工智能
通义千问大模型价格直线下调,优惠升级!更有新用户限时免费领取3600万额度!
通义大模型全线9款直降,最高达97%,阿里云MaaS(模型即服务)让推理成本大幅降低,加速AI应用爆发。 即刻登录阿里云百炼官网https://bailian.aliyun.com调用体验,新用户免费限时赠送3600万tokens!
|
1月前
|
消息中间件 缓存 监控
中间件如果缓存中存在所需的数据(缓存命中)
【5月更文挑战第12天】中间件如果缓存中存在所需的数据(缓存命中)
37 3
|
1月前
|
存储 缓存 监控
|
1月前
|
存储 缓存 JavaScript
vue中缓存页面数据(刷新不丢失)
vue中缓存页面数据(刷新不丢失)
|
20天前
|
存储 缓存 NoSQL
了解Redis,第一弹,什么是RedisRedis主要适用于分布式系统,用来用缓存,存储数据,在内存中存储那么为什么说是分布式呢?什么叫分布式什么是单机架构微服务架构微服务的本质
了解Redis,第一弹,什么是RedisRedis主要适用于分布式系统,用来用缓存,存储数据,在内存中存储那么为什么说是分布式呢?什么叫分布式什么是单机架构微服务架构微服务的本质