ModelScope数据集是方便共享和访问的数据集合,可用于算法训练、测试、验证,通常以表格形式出现。按照模态可划分为文本、图像、音频、视频、多模态等。例如,如果您感兴趣的是图像数据集,那么一条数据可能是一个图像文件的路径。您可以通过MsDataset类从ModelScope中加载数据集,这个类支持批量加载图像文件和.zip包中的图像文件。此外,数据集中的每条数据在训练和评估过程中都会被输入模型进行学习或效果评估。
可以print查看,比如:
ds = MsDataset.load('cats_and_dogs', namespace='tany0699', split='train')
print(next(iter(ds))),此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”