ModelScope麻烦请看一下这个?

ModelScope麻烦请看一下这个?c996252e47e4792b61f69c83bb74f5fe.png
ab595bc2255173e35f5a100d2de612fb.png

展开
收起
真的很搞笑 2023-09-12 19:54:14 110 分享 版权
1 条回答
写回答
取消 提交回答
  • 没问题啊bf81229ac15a15147db721e44cbd3e57.png

    Experimental environment: 2 * A100

    nproc_per_node=2
    CUDA_VISIBLE_DEVICES=0,1 \
    torchrun \
    --nproc_per_node=$nproc_per_node \
    --master_port 29500 \
    src/llm_sft.py \
    --model_type qwen-7b-chat \
    --sft_type lora \
    --template_type chatml \
    --dtype bf16 \
    --output_dir runs \
    --ddp_backend nccl \
    --dataset wlgb-zh \
    --dataset_sample -1 \
    --num_train_epochs 10 \
    --max_length 1024 \
    --lora_rank 8 \
    --lora_alpha 32 \
    --lora_dropout_p 0.05 \
    --lora_target_modules c_attn c_proj \
    --gradient_checkpointing false \
    --batch_size 1 \
    --weight_decay 0. \
    --learning_rate 1e-4 \
    --gradient_accumulation_steps $(expr 16 / $nproc_per_node) \
    --max_grad_norm 0.5 \
    --warmup_ratio 0.03 \
    --eval_steps 100 \
    --save_steps 100 \
    --save_total_limit 2 \
    --logging_steps 10 \
    --use_flash_attn true \
    --push_to_hub false \
    --hub_model_id qwen-7b-chat-lora \
    --hub_private_repo true \
    --hub_token 'your-sdk-token' \
    如果数据集多的话, --num_train_epochs 10 \ 你自己调整一下就好啦,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-09-13 07:48:50
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理