使用PAI-EAS一键部署ChatGLM及LangChain应用

简介: 本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。

使用PAI-EAS一键部署ChatGLM及LangChain应用


1. 实验资源方式简介及开始实验

云起实验室实验资源方式介绍

云起实验室支持开通免费试用、个人账户资源两种实验资源方式。

领取免费试用额度

使用个人账号开通试用,平台仅提供手册参考。

所有实验操作将保留至您的账号,请谨慎操作。

在实验页面下方卡片会展示本实验支持的试用规格,可以选择你要试用的云产品资源进行开通。您在实验过程中,可以随时用右下角icon唤起试用卡片。阿里云支持试用的产品列表、权益及具体规则说明请参考开发者试用中心

说明:试用云产品开通在您的个人账号下,并占用您的试用权益。如试用超出免费试用额度,可能会产生一定费用。

个人账户资源

使用您个人的云资源进行操作,资源归属于个人。

所有实验操作将保留至您的账号,请谨慎操作。

平台仅提供手册参考,不会对资源做任何操作。

说明:使用个人账户资源,在创建资源时,可能会产生一定的费用,请您及时关注相关云产品资源的计费概述。

准备开始实验

在实验开始前,请您选择其中一种实验资源,单击确认开启实验

说明:每个实验所支持的实验资源方式都不相同,实验不一定能满足有三种实验资源方式,请根据实验的实际情况,进行选择。


2. 准备环境及资源

实验前必看!

开始教程前,请按以下步骤准备环境和资源:

重要:PAI-EAS抵扣包只适用于本教程中的PAI-EAS产品。如果您领取了PAI-EAS抵扣包后,使用了PAI-EAS及PAI的其他产品功能(如PAI-DSW、PAI-DLC等),PAI-EAS产品产生的费用由抵扣包抵扣,其他产品功能产生的费用无法抵扣,会产生对应的费用账单

如果您的阿里云账号只能领取部分免费试用产品,请您领取符合免费试用资格的产品,然后进入实验,不满足免费试用资格的产品将会使用个人账户资源进行创建,并会产生一定的费用,请您及时关注账户扣费

为了避免资源浪费并造成账号扣费的情况,请严格按照本文提供的参数进行配置。在实验完成之后,请您及时删除或禁用压测任务。

在实验开始前,请您选择领取免费试用额度

申请免费使用PAI-EAS。

模型在线服务PAI-EAS卡片上单击立即试用

模型在线服务PAI-EAS面板,勾选服务协议后,单击立即试用,如弹出新的页面,您可先忽略。

领取完免费试用后,返回资源领取界面,单击我已开通,进入实验

说明:第一次使用控制台需要创建默认工作空间,步骤如下,若开通过则跳过此步骤

4.1 前往PAI控制台

4.2 开通机器学习PAI并创建默认工作空间。其中关键参数配置如下。

本教程地域选择:华南2(河源)

组合开通:本教程无需使用其他产品,去除勾选MaxCompute和DataWorks产品。如果您勾选了MaxCompute和DataWorks产品,在开通时会产生如下图报错。

服务角色授权:单击去授权,完成服务角色授权。

说明:更多详细内容,请参见开通并创建默认工作空间。如果您后续使用RAM用户来部署模型,您需要将RAM用户添加为默认工作空间的成员,并配置管理员角色,详情请参见管理成员;同时,需要为RAM用户授予PAI-EAS的管理权限,详情请参见云产品依赖与授权:EAS

2.3 返回如下页面,表示您已成功开通机器学习PAI并创建默认工作空间。

说明: 如果您在开通时出现Create workspace failed, status: FAILURE!报错提示,您可忽略此报错,继续进行下一步实验操作。


3. 开通工作空间

若您的免费试用资格已过期或已无试用资格,您可以使用个人账户资源, 计费标准详情请参考计费概述。如需长期使用本服务,请仔细阅读计费概述,避免产生意料之外的费用;如仅为体验功能不做长期使用,完成实验后请及时清理

选择个人账号资源,点击确认开启实验。

创建模型在线服务PAI-EAS。

说明:您此步的创建会用您个人的资源,使用期间可能会产生费用。

2.1 前往PAI控制台

2.2 开通机器学习PAI并创建默认工作空间。其中关键参数配置如下。如果您已经开通了工作空间,可直接前往控制台。

本教程地域选择:华南2(河源)

组合开通:本教程无需使用其他产品,去除勾选MaxCompute和DataWorks产品。如果您勾选了MaxCompute和DataWorks产品,在开通时会产生如下图报错。

服务角色授权:单击去授权,完成服务角色授权。

说明:更多详细内容,请参见开通并创建默认工作空间。如果您后续使用RAM用户来部署模型,您需要将RAM用户添加为默认工作空间的成员,并配置管理员角色,详情请参见管理成员;同时,需要为RAM用户授予PAI-EAS的管理权限,详情请参见云产品依赖与授权:EAS

2.3 返回如下页面,表示您已成功开通机器学习PAI并创建默认工作空间。

说明: 如果您在开通时出现Create workspace failed, status: FAILURE!报错提示,您可忽略此报错,继续进行下一步实验操作。


4. 进入PAI EAS模型在线服务页面

进入PAI EAS模型在线服务页面。

登录PAI控制台

在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

在工作空间页面的左侧导航栏选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面。


5. 部署ChatGLM模型服务

在PAI EAS模型在线服务页面,单击部署服务

部署服务页面,配置以下关键参数。

参数

描述

服务名称

自定义服务名称。本案例使用的示例值为:chatglm_demo

部署方式

选择镜像部署AI-Web应用

镜像选择

在PAI平台镜像列表中选择chatglm-webui;镜像版本选择1.0

说明 :由于版本迭代迅速,部署时镜像版本选择最高版本即可。

运行命令

选择镜像版本后系统自动配置运行命令python webui/webui_server.py --listen --port=8000和端口号:8000。

其中:命令行参数--listen用于将WebUI服务或程序绑定到外部服务连接,从而使WebUI服务或程序能够接收外部服务的请求并对其进行处理。

资源组种类

选择公共资源组

资源配置方法

选择常规资源配置

资源配置选择

  • 如果您使用免费试用资源,本教程实例规格选择试用活动页签的ecs.gn7i-c8g1.2xlarge.limit
  • 如果您使用个人账户资源,本教程实例规格选择GPU页签的ml.gu7i.c16m60.1-gu30

说明阿里云免费试用提供的机型包括以下三种机型,仅选择试用活动页签下的这三种机型来部署服务产生的费用,才能使用抵扣包抵扣。 ecs.g6.xlarge.limit ecs.gn6i-c8g1.2xlarge.limit ecs.gn7i-c8g1.2xlarge.limit

使用免费试用资源:试用活动-ecs.gn7i-c8g1.2xlarge.limit

b. 使用个人资源:GPU-ml.gu7i.c16m60.1-gu30

单击部署,等待一段时间即可完成模型部署

当服务状态为运行中时,表明服务部署成功。


6. 启动WebUI进行模型推理

单击目标服务服务方式列下的查看Web应用

在WebUI页面,进行模型推理验证。

在①位置输入请求数据,单击②位置的发送按钮,即可在③位置输出推理结果。


7. 使用langchain来集成自己的业务数据

LangChain功能介绍:

LangChain是一个开源的框架,可以让AI开发人员将像GPT-4这样的大语言模型(LLM)和外部数据结合起来,从而在尽可能少消耗计算资源的情况下,获得更好的性能和效果。

LangChain工作原理:

将一个大的数据源,比如一个20页的PDF文件,分成各个区块,然后把它们嵌入到一个向量存储(Vector Store)里。

LangChain首先将输入的用户数据进行自然语言处理并作为大模型的知识库存储在本地。每次推理用户的输入会首先在本地知识库中查找与输入问题相近的答案,并将知识库答案与用户输入一起输入大模型生成基于本地知识库的定制答案。

设置方法:

在WebUI页面上方Tab页选择LangChain

在WebUI页面左下角,按照界面操作指引拉取自定义数据,支持配置.txt、.md、.docx、.pdf格式的文件。

例如上传README.md文件,单击左下角的知识库文件向量化,返回如下结果表明自定义数据加载成功。

在WebUI页面底部输入框中,输入业务数据相关的问题进行对话即可。

例如在输入框中输入如何安装deepspeed,单击发送,返回结果如下图所示。


8. (可选)启动模型服务

说明:如果您部署的模型状态为运行中您可忽略此步骤。

如果30分钟未调用服务,服务实例会自动缩容为0,模型状态为已停止

如果需要再次使用,请在PAI EAS模型在线服务页面中,单击上述步骤中部署模型操作列下的启动。当模型状态已停止变为运行中,表明服务已运行正常。


9. 清理

清理

领取抵扣包后,请在抵扣包额度和有效期内使用。如果抵扣包额度用尽或超出有效期,继续使用计算资源,会产生后付费账单。

请前往节省计划页面,查看抵扣包剩余金额和过期时间。

如果无需继续使用EAS服务,您可以按照以下操作步骤删除模型服务。

登录PAI控制台

在页面左上方,选择服务的地域。

在左侧导航栏单击工作空间列表,在工作空间列表页面中单击默认工作空间名称,进入对应工作空间内。

在工作空间页面的左侧导航栏选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面。

在推理服务页签,单击目标服务操作列下的删除,删除模型服务。

如果需要继续使用EAS服务,请务必至少在抵扣包额度用尽或试用到期1小时前为您的阿里云账号充值,到期未续费的EAS服务会因欠费而被自动停止。

实验链接:https://developer.aliyun.com/adc/scenario/96067309564244e8a373a69401281f2d

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
前端开发 机器人 API
前端大模型入门(一):用 js+langchain 构建基于 LLM 的应用
本文介绍了大语言模型(LLM)的HTTP API流式调用机制及其在前端的实现方法。通过流式调用,服务器可以逐步发送生成的文本内容,前端则实时处理并展示这些数据块,从而提升用户体验和实时性。文章详细讲解了如何使用`fetch`发起流式请求、处理响应流数据、逐步更新界面、处理中断和错误,以及优化用户交互。流式调用特别适用于聊天机器人、搜索建议等应用场景,能够显著减少用户的等待时间,增强交互性。
4655 2
|
11月前
|
存储 人工智能 测试技术
Nacos托管LangChain应用Prompts和配置,助力你的AI助手快速进化
AI 应用开发中,总有一些让人头疼的问题:敏感信息(比如 API-KEY)怎么安全存储?模型参数需要频繁调整怎么办?Prompt 模板改来改去,每次都得重启服务,太麻烦了!别急,今天我们就来聊聊如何用 Nacos 解决这些问题。
|
存储 机器学习/深度学习 数据采集
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
|
监控 数据安全/隐私保护 异构计算
借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
【8月更文挑战第8天】借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
336 1
|
人工智能 异构计算
基于PAI-EAS一键部署ChatGLM及LangChain应用
【8月更文挑战第7天】基于PAI-EAS一键部署ChatGLM及LangChain应用
|
5月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习算法篇】K-近邻算法
K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
1477 6
|
10月前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
681 8
|
11月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。

相关产品

  • 人工智能平台 PAI