"ModelScope中,微调参数里面有可能会导致模型回复中断的参数或者是数据里面没有长文本的数据?
NCCL_P2P_DISABLE=1 NCCL_IB_DISABLE=1 CUDA_VISIBLE_DEVICES=0 \
swift sft \
--model_id_or_path /root/Qwen2-7B-Instruct \
--sft_type lora \
--dtype AUTO \
--dataset AI-ModelScope/alpaca-gpt4-data-zh#500 AI-ModelScope/alpaca-gpt4-data-en#500 swift/self-cognition#500 /root/swift/swift/llm/data/Dabby_03.jsonl#981 \
--model_name 。。. \
--model_author 。。。 \
--num_train_epochs 6 \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.05 \
--max_length 4096 \
--lora_target_modules ALL \
--gradient_checkpointing true \
--batch_size 4 \
--weight_decay 0.1 \
--learning_rate 1e-4 \
--gradient_accumulation_steps 16 \
--use_flash_attn true \
--model_type qwen2-7b-instruct \
--output_dir /root/swift/output"
长文本这种情况遇到的比较少,文档中有个群,您和其他开发者交流一下哈,参考以下链接
https://github.com/modelscope/swift/blob/main/README_CN.md
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352