qwen1.5,微调训练的时候,ModelScope官方给的参数能否直接使用,有什么需要注意的吗?

"qwen1.5,微调训练的时候,ModelScope官方给的参数能否直接使用,有什么需要注意的吗?
DISTRIBUTED_ARGS=""
--nproc_per_node $NPROC_PER_NODE \
--nnodes $NNODES \
--node_rank $NODE_RANK \
--master_addr $MASTER_ADDR \
--master_port $MASTER_PORT
""

torchrun $DISTRIBUTED_ARGS src/train_bash.py \
--deepspeed $DS_CONFIG_PATH \
--stage sft \
--do_train \
--use_fast_tokenizer \
--flash_attn \
--model_name_or_path $MODEL_PATH \
--dataset your_dataset \
--template qwen \
--finetuning_type lora \
--lora_target q_proj,v_proj\
--output_dir $OUTPUT_PATH \
--overwrite_cache \
--overwrite_output_dir \
--warmup_steps 100 \
--weight_decay 0.1 \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--ddp_timeout 9000 \
--learning_rate 5e-6 \
--lr_scheduler_type cosine \
--logging_steps 1 \
--cutoff_len 4096 \
--save_steps 1000 \
--plot_loss \
--num_train_epochs 3 \
--bf16"

展开
收起
小小爱吃香菜 2024-05-01 08:56:48 182 分享 版权
阿里云 AI 助理回答

在微调训练Qwen1.5模型时,ModelScope官方提供的参数可以作为参考,但需要根据实际的硬件环境、数据集和任务需求进行调整。以下是对您提供的命令及参数的详细解析和注意事项:


1. 分布式训练参数

DISTRIBUTED_ARGS="    --nproc_per_node $NPROC_PER_NODE \    --nnodes $NNODES \    --node_rank $NODE_RANK \    --master_addr $MASTER_ADDR \    --master_port $MASTER_PORT"
  • --nproc_per_node:每个节点使用的GPU数量。确保该值与实际可用的GPU数量一致。
  • --nnodes:分布式训练中使用的节点总数。如果仅使用单机,则设置为1。
  • --node_rank:当前节点的排名(从0开始)。单机训练时通常为0。
  • --master_addr--master_port:主节点的IP地址和端口号,用于多节点通信。

注意事项: - 如果是单机训练,可以忽略--nnodes--node_rank--master_addr--master_port,直接设置--nproc_per_node即可。 - 确保所有节点之间的网络连接正常,并且端口未被占用。


2. 微调训练核心参数

torchrun $DISTRIBUTED_ARGS src/train_bash.py \
    --deepspeed $DS_CONFIG_PATH \
    --stage sft \
    --do_train \
    --use_fast_tokenizer \
    --flash_attn \
    --model_name_or_path $MODEL_PATH \
    --dataset your_dataset \
    --template qwen \
    --finetuning_type lora \
    --lora_target q_proj,v_proj \
    --output_dir $OUTPUT_PATH \
    --overwrite_cache \
    --overwrite_output_dir \
    --warmup_steps 100 \
    --weight_decay 0.1 \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --ddp_timeout 9000 \
    --learning_rate 5e-6 \
    --lr_scheduler_type cosine \
    --logging_steps 1 \
    --cutoff_len 4096 \
    --save_steps 1000 \
    --plot_loss \
    --num_train_epochs 3 \
    --bf16

(1) DeepSpeed配置

  • --deepspeed $DS_CONFIG_PATH:指定DeepSpeed配置文件路径。DeepSpeed是一种优化工具,用于加速训练并减少显存占用。
    • 建议:根据硬件资源调整DeepSpeed配置文件中的优化器、梯度累积等参数。

(2) 训练阶段

  • --stage sft:指定训练方式为监督微调(SFT)。如果需要使用直接偏好优化(DPO),可将stage改为dpo

(3) 数据集与模板

  • --dataset your_dataset:指定训练数据集路径。数据格式需符合JSON格式要求,例如:
    [
    {
      "instruction": "问题",
      "output": "答案"
    }
    ]
    
    • 注意:确保数据集已上传至OSS或本地路径,并正确配置路径。
  • --template qwen:指定模型默认的对话模板。如果数据格式不符合模板要求,可能需要自定义模板。

(4) LoRA轻量化训练

  • --finetuning_type lora:启用LoRA(Low-Rank Adaptation)轻量化训练。
  • --lora_target q_proj,v_proj:指定LoRA作用的目标层。可以根据任务需求调整目标层。
    • 建议:LoRA维度(lora_dim)和权重(lora_alpha)可通过超参数配置,默认值分别为32和32。

(5) 批次与学习率

  • --per_device_train_batch_size 4:每个GPU每次处理的样本数量。较大的批次大小会提高效率,但也会增加显存需求。
  • --gradient_accumulation_steps 4:梯度累积步数。当显存不足时,可以通过增加此值模拟更大的批次大小。
  • --learning_rate 5e-6:学习率。默认值为5e-5,但可根据任务需求调整。
  • --lr_scheduler_type cosine:学习率调度器类型。cosine调度器适合长周期训练。

(6) 其他重要参数

  • --cutoff_len 4096:输入序列的最大长度。确保该值不超过模型支持的最大长度。
  • --save_steps 1000:每隔多少步保存一次模型。根据训练数据量和时间需求调整。
  • --bf16:启用bfloat16精度训练,以减少显存占用并加速训练。

3. 注意事项与建议

  1. 硬件资源

    • 确保GPU资源充足,推荐使用V100/P100/T4(16GB显存)或更高配置。
    • 如果显存不足,可以尝试以下方法:
      • 减小per_device_train_batch_size
      • 增加gradient_accumulation_steps
      • 启用bf16load_in_4bit/load_in_8bit轻量化训练。
  2. 数据准备

    • 数据集需符合JSON格式要求,并上传至OSS或本地路径。
    • 如果使用PAI预置的公共数据集,可以直接测试算法。
  3. 超参数调整

    • 根据任务需求调整学习率、批次大小、训练轮数等超参数。
    • 默认值适用于大多数场景,但特定任务可能需要进一步优化。
  4. 分布式训练

    • 如果使用多节点训练,确保所有节点之间的网络连接正常,并正确配置master_addrmaster_port

总结

ModelScope官方提供的参数可以作为起点,但需要根据实际硬件环境、数据集和任务需求进行调整。重点关注硬件资源、数据格式、超参数配置以及分布式训练的设置。通过合理调整这些参数,可以有效提升微调训练的效果和效率。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理