1. 教程简述
本教程中,您将学习如何在阿里云模型在线服务(PAI-EAS)一键部署基于开源模型通义千问的WebUI应用,以及使用WebUI和API进行模型推理。
通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制开发了基于大语言模型的AI助手Qwen-7B-Chat。
本教程部署通义千问WebUI示例效果如下所示:
基于本教程可以体验:
新用户可免费领取价值万元的人工智能平台PAI 试用资源;
学会如何快速在阿里云上创建模型在线服务;
学会如何在ESA中部署WebUI。
2. 使用PAI-EAS一键部署通义千问WebUI
2.1 准备环境与资源
2.1.1 领取模型在线服务PAI-EAS免费试用权益
前往活动页面,领取模型在线服务PAI-EAS产品免费试用资源包
- 对于模型在线服务PAI-EAS 的新用户,提供免费试用A10/T4/G6机型500元抵扣包,有效期1个月,可以在活动页面中直接领取(试用规则请参照阿里云免费试用);或可以购买PAI-EAS资源包参与活动,购买链接:PAI-EAS 59元/抵两百元资源包;如不购买资源包,PAI-EAS会按量进行计费,计费标准详见阿里云产品定价。
2.1.2 部署模型
- 前往人工智能平台PAI控制台
- 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
- 在人工智能平台PAI控制台内,选择模型在线服务PAI-EAS,点击部署服务
- 部署方式选择-镜像部署AI-Web应用,镜像选择-PAI平台镜像 modelscope-inference
环境变量:参数参考下图
参数 |
描述 |
服务名称 |
自定义服务名称。本案例使用的示例值为:qwen_demo。 |
部署方式 |
选择镜像部署AI-Web应用。 |
镜像选择 |
选择PAI平台镜像>modelscope-inference>1.8.1。 |
环境变量 |
MODEL_ID输入:qwen/Qwen-7B-Chat TASK输入:chat REVISION输入:v1.0.5 |
运行命令 |
服务运行命令:python app.py 输入端口号:8000 |
- 选择实例机型 ecs.gn7i-c8g1.2xlarge.limit ,若无此机型库存可更换地域尝试;
在领取免费试用权益后(参考步骤1.1),试用活动tab分类下的机型支持免费试用;若不符合领用条件或免费试用机型无库存,可选择GPU分类下的GU30机型(ml.gu7i.c8m30.1-gu30),需自费,约8元/小时。
- 单击部署,进入PAI-EAS 模型在线服务,等待服务状态变更为运行中,表示模型部署完成。
说明一般在5分钟能够完成部署,具体与资源紧缺程度、服务负载以及配置有关。
2.2 使用WebUI进行模型推理
2.2.1 单击目标服务的服务方式> 查看Web应用,打开WebUI页面。
2.2.2 在WebUI页面,进行模型推理验证。
3. 资源清理及后续
3.1 清理
- 领取抵扣包后,请在抵扣包额度和有效期内使用。如果抵扣包额度用尽或超出有效期,继续使用计算资源,会产生后付费账单。请前往节省计划页面,查看抵扣包剩余金额和过期时间。
- 如果无需继续使用EAS服务,您可以按照以下操作步骤停止/删除模型服务。
如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊