ModelScope中,fine tune 怎么加载官方的数据集呢?

ModelScope中,fine tune 怎么加载官方的数据集呢?# Remember to use --fp16 instead of --bf16 due to autogptq
python finetune.py \
--model_name_or_path $MODEL \
--dataset modelscope/DuReader_robust-QG \

展开
收起
多麻辣哦 2023-11-08 20:32:27 181 分享 版权
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    加载官方数据集可以通过将数据集位置传入命令行参数实现。在上述例子中,“$MODEL” 是要使用的模型路径,“modelscope/DuReader_robust-QG” 是要加载的数据集路径。
    这意味着在调用 fine-tuning 脚本时,您应替换其中 “modelscope/DuReader_robust-QG” 部分为所需官方数据集的位置。
    请确保您已经拥有适当的权限访问此数据集,并且您所提供的路径是正确的。

    2023-11-09 14:22:07
    赞同 展开评论
  • 在ModelScope中,要加载官方的数据集,可以使用以下命令:

    python finetune.py \
    --model_name_or_path $MODEL \
    --dataset modelscope/DuReader_robust-QG \
    --do_train \
    --do_eval \
    --max_seq_length 512 \
    --per_device_train_batch_size 8 \
    --learning_rate 3e-5 \
    --num_train_epochs 3 \
    --output_dir output \
    --overwrite_output_dir \
    --fp16
    

    这里使用了--do_train--do_eval参数来指定进行训练和评估。--max_seq_length参数用于设置输入序列的最大长度,--per_device_train_batch_size参数用于设置每个设备的训练批次大小,--learning_rate参数用于设置学习率,--num_train_epochs参数用于设置训练轮数,--output_dir参数用于设置输出目录,--overwrite_output_dir参数用于覆盖已有的输出目录,--fp16参数用于使用半精度浮点数进行训练。

    2023-11-09 11:08:09
    赞同 展开评论
  • https://github.com/modelscope/swift/tree/main/examples/pytorch/llm
    可以看文档哈——此回答整理自钉群:魔搭ModelScope开发者联盟群 ①

    2023-11-08 21:40:04
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理