AIGC：在云上从0开始搭建ChatGLM2-6B LLM环境

2023-06-28 2029

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 清华的chatGLM前段时间发布了第二代chatGLM2-6B，已经开放使用了。本文介绍在云上从0开始搭建ChatGLM-6B LLM环境，供大家参考。

在云上从0开始搭建LLM环境

以在Ubuntu 18.04 64位系统搭建LLM环境，安装《ChatGLM2-6B》为例：

1、创建GPU实例（显存8GB以上，磁盘至少40G），本文选择了带P100 GPU的 ecs.gn5-c4g1.xlarge实例，并在实例创建时选择安装cuda 11.4。设置用户名及登录密码。

2、设置安全组配置，配置出方向端口22，并在源IP中加入本机IP。

3、 Ssh到云ECS。系统会提示正在安装CUDA，待安装完毕，查看GPU详情（若命令无法正常运行，则说明CUDA没安装好）：nvidia-smi

4、在ECS上安装相关软件包：

A、sudo apt-get update

B、安装gcc编译器(可选，系统中通常已有)：sudo apt install build-essential

C、安装Python，以3.8为例：sudo apt install python3.8

D、安装miniconda：

1) 下载安装包：注意miniconda包需选择对应python版本的包

wget https://repo.anaconda.com/miniconda/Miniconda3-py38_23.3.1-0-Linux-x86_64.sh

2) 运行安装脚本，并初始化：bash Miniconda3-py38_23.3.1-0-Linux-x86_64.sh

3) （可在2中完成）初始化终端 Shell，以便运⾏conda。~/miniconda3/bin/conda init

4) 初始化完成后，运行bash命令，即可进入conda环境：bash

5) 创建⼀个新的环境（可选）：conda create --name aigc python=3.8 -y

6) 激活aigc环境（可选）：conda activate aigc

5、安装git：sudo apt install git

6、git clone ChatGLM2-6B，并安装软件依赖：

git clone https://github.com/THUDM/ChatGLM2-6B

cd ChatGLM2-6B && pip install -r requirements.txt

pip install fastapi uvicorn

7、将模型下载到本地，从本地加载：

安装git-lfs：apt install git-lfs

切换到待下载模型的文件夹路径（确保有15G以上空间），然后执行：

git clone https://huggingface.co/THUDM/chatglm2-6b

注意：模型有数个bin文件，共十几G大小。下载后需要切换到chatglm2-6b目录下检查模型文件大小。如果没有成功下载，可以使用如下命令来更新模型文件：

cd chatglm2-6b && git lfs pull

8、运行cli_demo：将代码中tokenizer和model变量中的"THUDM/chatglm2-6b"更换成模型本地路径。此外，如果希望固定使用的模型实现以保证兼容性，可在tokenizer和model的 from_pretrained 调用中增加 revision="v1.0" 参数。v1.0 是当前最新的版本号。示例：/home/fsnode/chatglm2-6b是本地模型路径。

tokenizer= AutoTokenizer.from_pretrained("/home/fsnode/chatglm2-6b", revision="v1.0", trust_remote_code=True)

model = AutoModel.from_pretrained("/home/fsnode/chatglm2-6b", revision="v1.0", trust_remote_code=True).half().cuda()

运行脚本：python cli_demo.py

9、（可选）运行web_demo：除了需要修改模型存放路径外（见上），Web如需要公网访问，还需要将web_demo.py中修改：share=True

A、安装gradio ：pip install gradio

B、在ECS上运行脚本：python web_demo.py

C、本地便携机上执行如下命令，将云ECS的7860端口映射到本地（IP及用户名填实际的）：

ssh -L7860:localhost:7860 root@ecs公网IP

D、在本地浏览器登录web界面：http://127.0.0.1:7860

10、运行基于Streamlit的网页版Demo（web_demo2.py）：web_demo.py有个缺陷，生成的公网链接是临时的，仅72小时有效。可使用Streamlit网页版。

A、安装需要的模块：pip install streamlit pip install streamlit-chat

B、修正web_demo2.py中的模型路径"THUDM/chatglm2-6b"为本地路径，并指定revision="v1.0"。

C、添加安全组规则：在ECS实例安全组的入方向添加安全组规则，并放行8501端口（该端口是默认端口，也可以自定义）。

D、运行DEMO：streamlit run web_demo2.py &。如果要指定服务端口，则需要在安全组放行该端口，运行时带上端口参数，如：streamlit run web_demo2.py --server.port 6006 &

参考：

https://github.com/THUDM/ChatGLM2-6B

AIGC：在云上从0开始搭建ChatGLM2-6B LLM环境

在云上从0开始搭建LLM环境

参考：

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

AIGC：在云上从0开始搭建ChatGLM2-6B LLM环境

在云上从0开始搭建LLM环境

参考：

热门文章

最新文章

相关课程

相关电子书

相关实验场景