ModelScope中,fine tune 怎么加载官方的数据集呢?# Remember to use --fp16 instead of --bf16 due to autogptq
python finetune.py \
--model_name_or_path $MODEL \
--dataset modelscope/DuReader_robust-QG \
加载官方数据集可以通过将数据集位置传入命令行参数实现。在上述例子中,“$MODEL” 是要使用的模型路径,“modelscope/DuReader_robust-QG” 是要加载的数据集路径。
这意味着在调用 fine-tuning 脚本时,您应替换其中 “modelscope/DuReader_robust-QG” 部分为所需官方数据集的位置。
请确保您已经拥有适当的权限访问此数据集,并且您所提供的路径是正确的。
在ModelScope中,要加载官方的数据集,可以使用以下命令:
python finetune.py \
--model_name_or_path $MODEL \
--dataset modelscope/DuReader_robust-QG \
--do_train \
--do_eval \
--max_seq_length 512 \
--per_device_train_batch_size 8 \
--learning_rate 3e-5 \
--num_train_epochs 3 \
--output_dir output \
--overwrite_output_dir \
--fp16
这里使用了--do_train
和--do_eval
参数来指定进行训练和评估。--max_seq_length
参数用于设置输入序列的最大长度,--per_device_train_batch_size
参数用于设置每个设备的训练批次大小,--learning_rate
参数用于设置学习率,--num_train_epochs
参数用于设置训练轮数,--output_dir
参数用于设置输出目录,--overwrite_output_dir
参数用于覆盖已有的输出目录,--fp16
参数用于使用半精度浮点数进行训练。
https://github.com/modelscope/swift/tree/main/examples/pytorch/llm
可以看文档哈——此回答整理自钉群:魔搭ModelScope开发者联盟群 ①