Alpaca模型在阿里云GPU服务器上的部署

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
无影云电脑企业版,4核8GB 120小时 1个月
简介: 【6月更文挑战第1天】

创建个人版的对话大模型。Alpaca大模型是一款基于LLaMA的大语言模型,它能够模拟自然语

操作步骤

创建ECS实例

  1. 实例创建:在ECS实例创建页面,创建一个ECS实例。选择实例规格为ecs.gn7i-c16g1.4xlarge,选择公共镜像Ubuntu 20.04,并确保选中了安装GPU驱动选项,选择CUDA版本为11.4.1,Driver版本为470.161.03,CUDNN版本为8.2.4

  2. 公网IP配置:选中分配公网IPv4地址,带宽计费方式选择按量付费,带宽峰值选择100Mbps。

  3. 安全组配置:在ECS实例安全组的入方向添加安全组规则并放行7860端口。

  4. 驱动和CUDA库安装验证

    • 使用root用户远程登录ECS实例。
    • 检查驱动以及CUDA库是否安装成功,执行命令查看GPU驱动和CUDA库的版本。

配置软件

  1. 安装Git和Git LFS

    apt install -y git git-lfs python-is-python3
    
  2. 安装Python包

    pip install git+https://github.com/huggingface/transformers
    pip install sentencepiece==0.1.97 -i https://pypi.tuna.tsinghua.edu.cn/simple
    pip install peft==0.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  3. 验证GPU工作

    • 进入PyTorch环境。
    • 执行torch.cuda.is_available()验证GPU是否正常工作。

下载与配置模型

  1. 下载tmux并创建session:建议在tmux session中下载模型,以免因ECS断开连接导致下载中断。

  2. 下载模型

    • 下载Chinese-LLaMA-Alpaca模型。
    • 下载chinese-alpaca-lora-13b模型。
    • 下载预训练的llama-13b-hf模型。
  3. 合并代码

    cd Chinese-LLaMA-Alpaca/
    python scripts/merge_llama_with_chinese_lora.py --base_model ~/llama-13b-hf/ \
         --lora_model ~/chinese-alpaca-lora-13b/ --output_type huggingface \
         --output_dir ./llama_with_lora_hf
    
  4. 查看转换完成的文件

    ls -lh llama_with_lora_hf
    

部署WebUI

  1. 下载WebUI并部署代码

    cd
    git clone https://github.com/oobabooga/text-generation-webui.git
    
  2. 安装依赖库

    cd text-generation-webui/
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  3. 生成软链接

    ln -s /root/Chinese-LLaMA-Alpaca/llama_with_lora_hf/ models/llama_with_lora_hf
    

验证结果

  1. 运行WebUI
    ```bash
    cd text-generation-webui/
    python server.py --model llama_with_lora_hf --listen --chat --load-in-8bit
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
目录
相关文章
|
1天前
|
弹性计算 缓存 安全
云服务器 ECS产品使用问题之如何解决阿里云幻兽帕鲁服务器游戏版本不兼容
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。
|
1天前
|
弹性计算 Linux 云计算
云服务器 ECS产品使用问题之如何解决阿里云幻兽帕鲁服务器转移后无法进入的问题
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。
|
1天前
|
SQL 弹性计算 API
云服务器 ECS产品使用问题之如何通过API调用阿里云服务器上SQL Server数据库中的数据
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。
|
1天前
|
弹性计算 网络安全 Nacos
云服务器 ECS产品使用问题之使用Docker部署Nacos时,遇到端口无法开放,该怎么办
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。
|
1天前
|
弹性计算
2024年阿里云免费云服务器及学生三百通用额度申请教程参考
阿里云2024年继续提供免费学生云服务器,最长可享7个月(1+6个月);还有300元无门槛抵用金,适用于全量公共云产品(特殊商品除外)。学生需完成身份认证和任务以领取和续费。此外,有3个月免费的飞天试用云服务器,分为个人和企业版。详细申请教程包括学生认证、试用产品选择等步骤,可访问指定阿里云链接进行操作。
73 2
|
1天前
|
分布式计算 DataWorks 调度
阿里云DataWorks-部署自定义python项目问题
阿里云DataWorks-多种方式部署自定义python项目并进行调度
|
2天前
|
弹性计算 固态存储 JavaScript
阿里云4核8g服务器多少钱?云服务器u1实例700元1年
阿里云4核8G ECS u1实例,支持约30个并发用户,适合日均1万IP访问。当前优惠价为700元/年。配置包括Intel Xeon处理器,4核8GB内存,1.5Gbps带宽,最高25万连接数,云盘IOPS达2万。公网带宽和应用效率影响并发数,3M带宽理论可支撑12个用户同时访问。系统盘为20-40GB ESSD Entry。
|
2天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线
|
3天前
|
弹性计算
阿里云ECS的使用心得
本文主要讲述了我是如何了解到ECS,使用ECS的一些经验,以及自己的感悟心得
|
3天前
|
弹性计算
阿里云ECS使用体验
在申请高校学生免费体验阿里云ECS云服务器后的一些使用体验和感受。

热门文章

最新文章

相关产品

  • 云服务器 ECS
  • GPU云服务器