ModelScope Qwen-7B微调时报错各位大神遇到过吗?

ModelScope Qwen-7B微调时报错各位大神遇到过吗?
use_cache=True is incompatible with gradient checkpointing. Setting `use_cache=False

展开
收起
青城山下庄文杰 2023-08-21 15:00:22 478 分享 版权
1 条回答
写回答
取消 提交回答
  • 我看数据集只有15个, 好像有点少诶,如果数据集少的话,你可能需要设置一下 save_steps参数,周六日 我更新一版 基于chat后sft的脚本,需要的数据集会少一点,你可以用那个版本训练-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-08-21 20:29:48
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理