AIGC:在云上从0开始搭建langchain-ChatGLM,构建私域知识问答机器人DEMO

简介: AIGC短板:知识茧房(缺少行业领域的私域数据,专有问题解答效果差;数据时效性缺陷,对实时要求高的问题效果差)。 解法之一:私域数据Embedding +向量数据库(语义检索---向量相似度匹配)。将问题向量化,结合私域知识库中匹配到的“精确”内容,生成高质量prompt,再结合LLM的既有知识,以及概括、推理、扩展等能力,大大提升回答的准确性。 本文介绍了在阿里云上从0开始搭建langchain-ChatGLM,构建私域知识问答机器人DEMO。可用于日常学习和研究,减少环境搭建时踩坑。
+关注继续查看

简介

AIGC短板:知识茧房(缺少行业领域的私域数据,专有问题解答效果差;数据时效性缺陷,对实时要求高的问题效果差)。

解法之一:私域数据Embedding +向量数据库(语义检索---向量相似度匹配)。将问题向量化,结合私域知识库中匹配到的“精确”内容,生成高质量prompt,再结合LLM的既有知识,以及概括、推理、扩展等能力,大大提升回答的准确性。这也是langchain-ChatGLM的基本原理:

image.png


本文介绍了在阿里云上从0开始搭建langchain-ChatGLM,构建私域知识问答机器人DEMO。可用于日常学习和研究,减少环境搭建时踩坑。


安装步骤

以在Ubuntu 18.04 64系统搭建LLM环境,安装《langchain-ChatGLM》为例:

 

1、 创建GPU实例(显存8GB以上,磁盘至少50G),本文选择了带P100 GPU的 ecs.gn5-c4g1.xlarge实例,在实例创建时选择安装cuda 11.4。设置用户名及登录密码。

image.png

2、 设置安全组配置,配置出方向端口22,并在源IP中加入本机IP。

3、 Ssh到云ECS。如果是root登录,系统会提示正在安装CUDA,待安装完毕,查看GPU详情(若命令无法正常运行,则说明CUDA没安装好):nvidia-smi

image.png

4、 在ECS上安装相关软件包:

A、sudo apt-get update

B、安装gcc编译器(可选,系统中通常已有)sudo apt install build-essential

C、安装Python,以3.8为例:sudo apt install python3.8

D、安装miniconda

1)下载安装包:注意miniconda包需选择对应python版本的包

wget https://repo.anaconda.com/miniconda/Miniconda3-py38_23.3.1-0-Linux-x86_64.sh

2)运行安装脚本,并初始化:bash Miniconda3-py38_23.3.1-0-Linux-x86_64.sh

(3)(可在2中完成)初始化终端 Shell,以便运conda~/miniconda3/bin/conda init

4)初始化完成后,运行bash命令,即可进入conda环境:bash

(5)创建个新的环境(可选):conda create --name aigc python=3.8 -y

(6)激活aigc环境(可选):conda activate aigc

5、安装gitsudo apt install git    

6git clone langchain-ChatGLM,并安装软件依赖:

git clone https://github.com/imClumsyPanda/langchain-ChatGLM.git

cd langchain-ChatGLM && pip install -r requirements.txt

pip install fastapi uvicorn

conda install nltk        # langchain依赖的语言工具包

 

7chatglm-6b模型及Embedding 模型,下载到本地(可从本地加载模型):目前支持chatglm-6b-int4-qe、chatglm-6b-int4、chatglm-6b-int8、chatglm-6b、chatyuan、moss。本文以chatglm-6b为例。注:模型需要占用数十G空间,可将ECS实例的本地盘格式化后挂载,将模型存放在本地盘上。

安装git-lfsapt install git-lfs

git-lfs clone https://huggingface.co/THUDM/chatglm-6b

 

# 下载 Embedding 模型,目前支持ernie-tiny、ernie-base、text2vec-base、text2vec,本文以text2vec为例。

$ git clone https://huggingface.co/GanymedeNil/text2vec-large-chinese /your_path/

# 模型需要更新时,可打开模型所在文件夹后拉取最新模型文件/代码

$ git lfs pull

 

8更新config/model_config.py中的模型路径为本地路径

llm_model_dict变量中"chatglm-6b""pretrained_model_name": "/home/fsnode/chatglm-6b"

embedding_model_dict变量中"text2vec""text2vec": "/home/fsnode/text2vec-large-chinese"

 

9、导入自有的文档到ecs,目前主要支持mdtxtpdfjpg格式。

 

10、运行CLIweb DEMO

cli_demopython cli_demo.py

webui:如需要公网访问,还需要将webui.py中修改:share=True

A、安装gradio pip install gradio

B在ECS实例安全组的入方向添加安全组规则,并放行8501端口(默认公网服务端口,也可以自定义)。

image.png

C、在ECS上运行脚本:python webui.py

D、脚本运行成功后,会展示生成的公网链接。在本机浏览器中输入该链接,就可以使用了。

image.png

此外,如果不想修改安全组端口,也无需公网访问。可以把模型的本地服务端口7860直接映射到自己的本地便携上,登录使用:

A、本地便携机上执行如下命令,将云ECS7860端口映射到本地(IP及用户名填实际的):

ssh -L7860:localhost:7860 ecs-user@本地便携IP

B、在本地浏览器登录web界面:http://127.0.0.1:7860


相同的问题,在未结合私域数据下,使用相同ChatGLM模型回答如下:从对比可以看出,无私域数据情况下的回答有明显的错误。而结合私域数据后,答案很准确。

image.png

知识库+LLM羊毛推荐

阿里云近期推出了60元包月的知识库+LLM体验活动,可用于测试、开发、学习、工作助理等,入口:https://common-buy.aliyun.com/?commodityCode=hitsdb_aigcsharepre_public_cn

详见:https://developer.aliyun.com/article/1322802


附录

参考资料:

https://github.com/THUDM/ChatGLM-6B#readme

https://github.com/imClumsyPanda/langchain-ChatGLM

https://github.com/imClumsyPanda/langchain-ChatGLM/blob/master/docs/FAQ.md

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
28天前
|
机器学习/深度学习 人工智能 自然语言处理
要创建一个专属的AI机器人并基于LLM(Language Learning Model)构建AI知识库问答应用
要创建一个专属的AI机器人并基于LLM(Language Learning Model)构建AI知识库问答应用
77 6
|
3月前
|
机器学习/深度学习 JSON 人工智能
LLM 系列 | 10: 如何用ChatGPT构建点餐机器人?
今天这篇小作文主要介绍如何用ChatGPT构建一个定制化的闲聊机器人和订餐机器人。
|
5月前
|
存储 JSON 前端开发
2、从零开始构建基于ChatGPT的嵌入式(Embedding)本地医疗客服问答机器人模型(看完就会,看到最后有惊喜)
本文中我使用的是后端语言golang,来调用的所有外部接口,但它们均是restful api,所以如果你使用的是其他语言,那么是完全可以替换的,包括nodejs或者直接使用前端请求都是可以实现我的功能的。后面有机会会使用vue3来添加一个页面,现在主要通过postman或者apifox来调试接口,主要为了验证逻辑想法。
970 0
|
机器人 定位技术
构建一个宇宙 3D 地图需要什么?科学家说:5000 个机器人就行
我们接下来要说的可不是什么暑期大片,而是真实存在的:美国能源部劳伦斯伯克利国家实验室真的设计出了一个天文系统,他们打算用这个需要用到 5000 个机器人的系统来找出新星系,并由此构建一个大型的宇宙 3D 地图。
133 0
构建一个宇宙 3D 地图需要什么?科学家说:5000 个机器人就行
|
分布式计算 Spark JavaScript
带你读《JavaScript机器人: 用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make:JavaScript Robotics》之三:节点船
本书将向你展示用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make以及如何使用它来编写你所制作的东西。让使用JavaScript控制硬件变得简单而有趣。
|
机器人 JavaScript 前端开发
带你读《JavaScript机器人: 用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make:JavaScript Robotics》之二:TypeBot
本书将向你展示用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make以及如何使用它来编写你所制作的东西。让使用JavaScript控制硬件变得简单而有趣。
|
机器人 JavaScript 前端开发
带你读《JavaScript机器人: 用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make:JavaScript Robotics》之一:用Lo-tech材料建造机器人
本书将向你展示用Raspberry Pi、Arduino和BeagleBone构建NodeBots Make以及如何使用它来编写你所制作的东西。让使用JavaScript控制硬件变得简单而有趣。
|
人工智能 机器人 机器学习/深度学习
七个聊天机器人构建平台:轻松打造自己的机器人
聊天机器人(chatterbot)是用来模拟人类对话或聊天的程序。世界上最早的聊天机器人诞生于20世纪80年代,名为"阿尔贝特",用BASIC语言编写而成。今天的互联网上,已出现"比利"、"艾丽斯"等聊天机器人。
2406 0
相关产品
检索分析服务 Elasticsearch版
大数据开发治理平台 DataWorks
日志服务
推荐文章
更多