借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 【8月更文挑战第8天】借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据

环境部署

本次体验用到了模型在线服务PAI-EAS,所以在正式开始部署体验前,需要先开通服务。如果你是新用户,可以领取免费试用资源。如下:

在模型在线服务PAI-EAS面板,单击立即试用,如下:

点击前往PAI控制台。如下:

从开通服务的时候我们可以很清晰地看到PAI-EAS服务目前支持的地域有北京、上海、杭州、深圳、成都、河源。为了方便,这里就直接选择了杭州。如下:

由于本次体验不需要开通其他服务,所以组合服务这里我们不要勾选,以免产生不必要的费用。

首次开通需要授权,点击授权前往RAM访问控制。如下:

点击同意授权即可。如下:

完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:

稍等片刻即可完成服务的开通。如下:

来到PAI控制台,点击左侧的工作空间列表,单击待操作的工作空间名称,进入对应工作空间内。如下:

在PAI EAS模型在线服务页面,单击部署服务。如下:

在选择部署方式面板,选择自定义部署,单击确定。如下:

在部署服务页面,自定义服务名称,选择镜像部署AI-Web应用,在PAI平台镜像列表中选择chat-llm-webui;镜像版本选择3.0,勾选协议,运行命令配置为:python webui/webui_server.py --port=8000 --model-path=Qwen/Qwen-7B-Chat。如下:

选择公共资源组,选择常规资源配置,如果你选择免费试用资源,则选择试用活动页签的ecs.gn7i-c8g1.2xlarge.limit实例规格。

如果此处使用个人账户资源,推荐选择GPU页签的ecs.gn7i-c8g1.2xlarge,或者选择GPU显存大于24GB规格的实例。

这里尤其要注意的是,本次部署体验参加免费试用抵扣的实例规格,只有如下三种,选择时需要甄别。

ecs.g6.xlarge.limit

ecs.gn6i-c8g1.2xlarge.limit

ecs.gn7i-c8g1.2xlarge.limit

完成如上配置后,点击部署。如下:

回到PAI控制台,在PAI-EAS服务处单击查看日志,可以看到部署时的日志信息。如下:

整个部署过程大约耗时3分钟,当服务状态为运行中时,表明完成部署。如下:

点击“查看Web应用”,即可开始体验了。如下:

如何利用LangChain来集成自己的业务数据,只需简单的上传并初始化即可。如下:

基于集成数据完成chat效率还是非常高的。如下:

基本上做到了秒解。这对于个人或企业知识库的构建帮助还是非常大的。

当然除了服务本身功能的实现外,基于PAI-EAS一键部署不但能带来更好的体验,而且对于服务的监控也是非常详细的。如下:

体验完成后一定要记得释放掉使用的资源,在推理服务页签,单击目标服务操作列下的删除,删除模型服务。如下:

体验总结

1、使用PAI-EAS一键部署ChatGLM和LangChain,大大简化了部署和集成的复杂度,用户无需过多配置即可快速部署ChatGLM模型。

2、LangChain提供了丰富的组件和灵活的配置方式,可以轻松地与外部数据进行交互,满足不同的应用场景需求。此外,LangChain框架的灵活性和高度抽象性使得集成外部数据变得相对简单,用户可以根据需求自定义模型的行为和输出。ChatGLM模型在集成LangChain后,能够结合外部数据生成更加准确和定制化的答案,显著提升了模型的应用效果。

3、ChatGLM模型在PAI-EAS的部署下表现出色,能够快速响应并生成高质量的回答。

4、值得好评的是通过选择免费试用资源或合理规划个人账户资源,可以在不产生过多费用的情况下,体验ChatGLM和LangChain的强大功能。

5、唯一的不足就是服务时常出现不可用,这可能跟使用的是公共资源有关,但好在每次恢复耗时并不长,弹性能力是真的好用。

综上,使用PAI-EAS一键部署ChatGLM,并通过LangChain集成外部数据,为开发人员提供了一个高效、灵活且成本效益高的解决方案。

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
打赏
0
1
1
0
1430
分享
相关文章
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如OpenAI的GPT-4、Claude-3.5-Sonnet等)。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。
云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践
3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B,在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,性能比肩Deepseek-R1,且部署成本大幅降低。并集成了与智能体 Agent 相关的能力,够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B,本实践带您部署体验专属 QwQ-32B模型服务。
阿里云PAI部署DeepSeek及调用
本文介绍如何在阿里云PAI EAS上部署DeepSeek模型,涵盖7B模型的部署、SDK和API调用。7B模型只需一张A10显卡,部署时间约10分钟。文章详细展示了模型信息查看、在线调试及通过OpenAI SDK和Python Requests进行调用的步骤,并附有测试结果和参考文档链接。
2719 11
阿里云PAI部署DeepSeek及调用
SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动
通过详细的步骤和示例代码,您可以在 SpringBoot 项目中成功集成 Flink CDC,并实时追踪 MySQL 数据库的变动。
215 43
DMS+ADB-PG支持一键部署QwQ-32B推理模型
3月6日,阿里云发布并开源全新推理模型通义千问QwQ-32B。现已支持在DMS+ADB上私域部署并与Dify打通使用。
阿里万相重磅开源,人工智能平台PAI一键部署教程来啦
阿里云视频生成大模型万相2.1(Wan)重磅开源!Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势,轻松实现高质量的视频生成。同时,万相还支持业内领先的中英文文字特效生成,满足广告、短视频等领域的创意需求。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署阿里万相重磅开源的4个模型,可获得您的专属阿里万相服务。
Airweave:快速集成应用数据打造AI知识库的开源平台,支持多源整合和自动同步数据
Airweave 是一个开源工具,能够将应用程序的数据同步到图数据库和向量数据库中,实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。
99 14
云上玩转DeepSeek系列之三:PAI-RAG集成联网搜索,构建企业级智能助手
本文将为您带来“基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。
DeepSeek服务器繁忙?拒绝稍后再试!基于阿里云PAI实现0代码一键部署DeepSeek-V3和DeepSeek-R1大模型
阿里云PAI平台支持零代码一键部署DeepSeek-V3和DeepSeek-R1大模型,用户可轻松实现从训练到部署再到推理的全流程。通过PAI Model Gallery,开发者只需简单几步即可完成模型部署,享受高效便捷的AI开发体验。具体步骤包括开通PAI服务、进入控制台选择模型、一键部署并获取调用信息。整个过程无需编写代码,极大简化了模型应用的门槛。
216 7
基于机器学习的数据分析:PLC采集的生产数据预测设备故障模型
本文介绍如何利用Python和Scikit-learn构建基于PLC数据的设备故障预测模型。通过实时采集温度、振动、电流等参数,进行数据预处理和特征提取,选择合适的机器学习模型(如随机森林、XGBoost),并优化模型性能。文章还分享了边缘计算部署方案及常见问题排查,强调模型预测应结合定期维护,确保系统稳定运行。
41 0

热门文章

最新文章

相关产品

  • 人工智能平台 PAI
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等