ModelScope中,微调参数里面有可能会导致模型回复中断的参数或者是数据里面没有长文本的数据?

"ModelScope中,微调参数里面有可能会导致模型回复中断的参数或者是数据里面没有长文本的数据?
NCCL_P2P_DISABLE=1 NCCL_IB_DISABLE=1 CUDA_VISIBLE_DEVICES=0 \
swift sft \
--model_id_or_path /root/Qwen2-7B-Instruct \
--sft_type lora \
--dtype AUTO \
--dataset AI-ModelScope/alpaca-gpt4-data-zh#500 AI-ModelScope/alpaca-gpt4-data-en#500 swift/self-cognition#500 /root/swift/swift/llm/data/Dabby_03.jsonl#981 \
--model_name 。。. \
--model_author 。。。 \
--num_train_epochs 6 \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.05 \
--max_length 4096 \
--lora_target_modules ALL \
--gradient_checkpointing true \
--batch_size 4 \
--weight_decay 0.1 \
--learning_rate 1e-4 \
--gradient_accumulation_steps 16 \
--use_flash_attn true \
--model_type qwen2-7b-instruct \
--output_dir /root/swift/output"

展开
收起
小小爱吃香菜 2024-08-13 10:58:45 58 发布于江西 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理