基于PAI-EAS一键部署ChatGLM及LangChain应用

简介: 【8月更文挑战第7天】基于PAI-EAS一键部署ChatGLM及LangChain应用

在部署开始之前,我们打开部署操作连接:https://developer.aliyun.com/adc/scenario/96067309564244e8a373a69401281f2d? 然后进行后面的正式部署操作

部署操作

进入部署操作页面,点击【再次实验】,初次进入会显示【开始实验】


选择【个人账号资源】,然后点击【确认开启实验】


进入人工智能平台PAI控制台,如果没有创建工作空间,那么需要先创建工作空间,这里我已经创建过工作空间了,因此直接就进入到已经创建好的工作空间中


在工作空间页面的左侧导航栏,选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面


点击【部署服务】,选择【自定义部署】


在部署页面输入服务名称、部署方式、镜像选择


运行命令默认即可,资源组种类选择公共资源组,资源配置选择GPU 实例规格 ecs.gn7i-c8g1.2xlarge


完成之后点击【部署】等待部署成功


当服务状态为运行中时,表明服务部署成功。


点击【查看Web应用】跳转到ChatGLM模型对话页面,在WebUI页面,进行模型推理验证


到这里,基于PAI-EAS一键部署ChatGLM的基本操作就完成了,整个部署过程按照文档指引操作,还是比较容易上手的。

使用体验

本次部署的操作很轻松,整个部署过程也没什么卡顿,也就是说个人或者企业都可以轻松的部署自己的语言大模型服务,且部署时间成本忽略。唯一的一点就是涉及到训练模型或者使用模型的服务器实例规格计费往往都比较贵,这点希望 可以提供一些资源包或者优惠来供新手体验使用,降低学习成本。


相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
9月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。
536 0
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
9月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型
阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司6月17日推出4560亿参数大模型M1,采用混合专家架构和闪电注意力机制,支持百万级上下文处理,高效的计算特性使其特别适合需要处理长输入和广泛思考的复杂任务。阿里云PAI-ModelGallery现已接入该模型,提供一键部署、API调用等企业级解决方案,简化AI开发流程。
|
11月前
|
机器学习/深度学习 人工智能 JSON
DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践
通过 PAI-ModelGallery,可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。
|
人工智能 自然语言处理 运维
Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。目前,PAI 已经支持 Qwen3 全系列模型一键部署,用户可以通过 PAI-Model Gallery 快速开箱!
|
Shell Android开发
Android系统 adb shell push/pull 禁止特定文件
Android系统 adb shell push/pull 禁止特定文件
1780 1
|
Android开发 Python
Python封装ADB获取Android设备wifi地址的方法
Python封装ADB获取Android设备wifi地址的方法
555 0
|
8月前
|
开发工具 Android开发
X Android SDK file not found: adb.安卓开发常见问题-Android SDK 缺少 `adb`(Android Debug Bridge)-优雅草卓伊凡
X Android SDK file not found: adb.安卓开发常见问题-Android SDK 缺少 `adb`(Android Debug Bridge)-优雅草卓伊凡
850 11
X Android SDK file not found: adb.安卓开发常见问题-Android SDK 缺少 `adb`(Android Debug Bridge)-优雅草卓伊凡

热门文章

最新文章