ModelScope在按照官方教程进行clip-cn的finetune的时候,请问该怎么解决呢?

"ModelScope在按照官方教程进行clip-cn的finetune的时候,如果把batch_size设置小于训练样本数就会报如下的错误,请问该怎么解决呢?1b7cf446453be73d2e73e29ad07aeceb.png
"

展开
收起
真的很搞笑 2023-09-12 19:54:26 129 分享 版权
2 条回答
写回答
取消 提交回答
  • "batchsize=8, 可以跑。2c90c577a6855a8c086ef27fa4d724b5.png
    镜像:registry.cn-beijing.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.0您看一下notebook镜像。打开终端可以更新modelscope的。pip install modelscope --upgrade# 使用混合精度训练,无需修改
    'use_fp16': True,

    改False试一下,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

    2023-09-13 07:54:08
    赞同 展开评论
  • 北京阿里云ACE会长
    1. 检查您的 GPU 是否支持混合精度训练(mixed precision training)。混合精度训练是一种在不损失准确性的情况下提高训练速度的方法。在 PyTorch 中,您可以使用 torch.cuda.amp 模块进行混合精度训练。但是,某些 GPU 可能不支持这种训练方法。您可以尝试禁用混合精度训练,看看问题是否得到解决。要禁用混合精度训练,请将以下代码添加到您的训练循环之前:

    import torch
    torch.autograd.set_detect_anomaly(False)
    CopyCopy

    1. 确保您的训练数据集已经正确加载。这个问题可能是由于训练数据集加载不正确导致的。请检查您的数据加载代码,确保数据集正确加载且没有损坏。
    1. 检查您的模型代码,确保在执行反向传播时没有对需要计算梯度的变量进行不必要的修改。这个问题可能是由于在反向传播过程中对变量进行了不应进行的修改导致的。请检查您的模型代码,确保在执行反向传播时没有对需要计算梯度的变量进行不必要的修改。
    2023-09-13 07:48:10
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理