ModelScope数据集使用的时候报错这个, 这是哪个数据空了?
问题可能出在您在加载数据集时提供的样本数量(num_samples)不是正整数。请检查您的代码中关于数据集加载的部分,确认是否正确设置了 num_samples 参数。
这里有一个可能的解决方案:将数据集划分为训练集和验证集,然后使用训练集进行训练。您可以使用以下代码将数据集划分为训练集和验证集:
from torch.utils.data import random_split
train_size = int(0.8 * len(dataset))
val_size = len(dataset) - train_size
train_set, val_set = random_split(dataset, [train_size, val_size])
CopyCopy
然后,您可以使用 train_set 进行训练:
trainer.train(train_set)

您看下,train_dataset长度是0,数据集创建有点问题
可能和您的数据只有一条有关。我下载下来,用加载本地文件的方式加载的,也是这个num_samples=0。,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”