备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中怎么在昇腾d卡上用swift做微调训练啊？

ModelScope中怎么在昇腾d卡上用swift做微调训练啊？

展开

收起

小小鹿鹿鹿 2024-03-05 15:42:55 179 版权

阿里云 AI 助理回答

在ModelScope中使用昇腾（Ascend）芯片进行Swift微调训练，需要结合阿里云PAI平台的相关工具和配置。以下是详细的步骤和操作指南：

1. 环境准备

在开始微调训练之前，您需要确保以下环境和资源已正确配置： - 硬件要求：昇腾（Ascend）芯片的计算资源。 - 软件环境： - 安装支持昇腾芯片的深度学习框架（如MindSpore或其他适配框架）。 - 配置ModelScope和Swift相关的依赖库。 - 数据存储：创建并挂载NAS文件系统，用于存储模型文件、训练数据和结果文件。

具体操作步骤：

登录阿里云PAI控制台，选择目标地域（如华北6乌兰察布）。
创建DSW实例，选择支持昇腾芯片的镜像（如pytorch-develop:1.12-gpu-py39-cu113-ubuntu20.04或适配昇腾的自定义镜像）。
挂载NAS存储卷，路径通常为/mnt/data/nas。

2. 下载模型

在ModelScope中下载目标模型文件，并将其加载到昇腾环境中。

操作步骤：

在DSW开发环境中打开Terminal。

执行以下命令下载模型文件（以Llama-3为例）：

mkdir /mnt/workspace/llama3-ckpts
cd /mnt/workspace/llama3-ckpts
git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B.git
cd Meta-Llama-3-8B
rm -rf .git

注意：如果无法访问ModelScope，请设置代理后再尝试。

3. 准备训练数据

根据您的任务需求，准备适合的训练数据集。例如，您可以使用英文诗歌数据集进行微调。

操作步骤：

在DSW的Notebook中执行以下命令下载示例数据集：

!wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/tutorial/llm_instruct/en_poetry_train.json

如果需要自定义数据集，请参考示例数据格式，准备符合任务需求的数据文件。

4. 安装Swift及相关依赖

Swift是ModelScope提供的轻量化微调工具，支持LoRA等高效微调方法。在昇腾环境中安装Swift及相关依赖。

操作步骤：

在DSW的Notebook中执行以下命令安装Swift及相关依赖：

!pip install modelscope==1.12.0 transformers==4.37.0
!pip install swift

确保安装的版本与昇腾芯片兼容。如果遇到兼容性问题，请参考昇腾官方文档调整安装配置。

5. 微调训练

使用Swift工具对模型进行微调训练。以下是一个典型的LoRA微调训练命令：

操作步骤：

在DSW的Notebook中执行以下命令启动微调训练：

!accelerate launch --num_processes 1 --config_file /ml/code/multi_gpu.yaml /ml/code/sft.py \
   --model_name ./LLM-Research/Meta-Llama-3-8B-Instruct/ \
   --model_type llama \
   --train_dataset_name en_poetry_train.json \
   --num_train_epochs 3 \
   --batch_size 8 \
   --seq_length 128 \
   --learning_rate 5e-4 \
   --lr_scheduler_type linear \
   --target_modules k_proj o_proj q_proj v_proj \
   --output_dir lora_model/ \
   --apply_chat_template \
   --use_peft \
   --load_in_4bit \
   --peft_lora_r 32 \
   --peft_lora_alpha 32

参数说明： - --model_name：指定模型路径。 - --train_dataset_name：指定训练数据集路径。 - --num_train_epochs：训练轮数。 - --batch_size：批量大小。 - --seq_length：序列长度。 - --learning_rate：学习率。 - --peft_lora_r 和 --peft_lora_alpha：LoRA微调的超参数。

重要提示：在昇腾环境中运行时，可能需要调整accelerate配置文件以适配昇腾芯片的分布式训练特性。

6. 模型推理与验证

完成微调后，可以使用Swift工具对模型进行推理验证。

操作步骤：

在DSW的Notebook中编写代码启动WebUI应用：

from swift import Swift
model = Swift.from_pretrained('lora_model/')
model.eval()

使用测试数据验证模型效果，并根据需要调整微调参数。

7. 部署模型服务

将微调后的模型部署为在线推理服务。

操作步骤：

将训练好的模型文件上传至OSS Bucket。
登录PAI控制台，进入EAS（弹性推理服务）页面。
配置服务参数，包括镜像地址、模型路径、运行命令等。
启动服务并通过WebUI验证推理效果。

注意事项

硬件兼容性：确保昇腾芯片的驱动和框架版本与Swift工具兼容。
数据隐私：在使用外部数据集时，请遵守相关法律法规。
性能优化：根据昇腾芯片的特性，调整训练参数以提升性能。

通过以上步骤，您可以在ModelScope中使用昇腾芯片完成Swift微调训练，并将模型部署为在线服务。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

相关问答

请问如何使用ms-swift工具验证模型微调的效果？

164

0

0

魔塔的swift web-ui 训练好后模型要怎么导出

148

0

0

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

193

1

0

ModelScope里我去微调模型，训练完成的模型会出现以下两种问题，怎么解决？

259

0

0

请问用modelscope里swift的dpo微调模型的断点Debug方式，有相关文档说明吗？

211

1

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

157

1

0

modelscope-funasr如何进行标点恢复模型的微调训练？

107

1

0

ModelScope中Swift框架下加载 deepseek-coder-v2-lite怎么回事？

166

1

0

ModelScope中，使用SWIFT的进行sft报错，这是要升级驱动？

175

1

0

ModelScope的swift ui界面上没得选择吧？要自己本地部署才行吧？

101

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

在Golang中序列化JSON字符串的教程

《突破启动瓶颈：Swift构建iOS应用时界面加载的深度优化策略》

ms swift torch 与 transformer版本问题造成的nonetype error

swift 教程

可调节推理预算，字节Seed团队开源大型语言模型 Seed-OSS 系列！

热门讨论

热门文章

cpu部署报错 Torch not compiled with CUDA enabled

dataset的版本问题导致与modelscope不兼容

ModelScope中，模型下载默认路径在哪个路径？

如何下载modelscope模型？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

com/action/joingroup?code=v1是什么意思

DeepSeek V3.1 昨天还能用tool，今天怎么就用不了了？

ModelScope下载速度慢怎么解决？

我正在搭建智能体，遇到下图问题，不知道怎么解决

展开全部

轻量高效，8B 性能强劲书生科学多模态模型Intern-S1-mini开源

📊 Quick BI 真实体验评测：小白也能快速上手的数据分析工具！

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

混元开源又+1：视频音效可以自动生成了

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

ModelScope体验人像卡通化模型

展开全部

还有其他疑问?