请教clip finetune demo里的muge数据集的格式手机怎么样的。怎么使用自定义数据集进
牧歌数据参见官方网站:https://tianchi.aliyun.com/muge 自定义数据集可以自己收集图文pair,然后利用huggingface datasets的csv接口处理local数据。 例如组织好了文件是train.txt,内容样例为 query\timage 1\timage_path_1 2\timage_path_2 ... dataset = load_dataset('csv', data_files='train.txt', sep='\t')['train'] dataset即为hf的dataset。而modelscope的msdataset支持hf dataset 更多dataset的使用可以参考:https://huggingface.co/docs/datasets/loading#local-and-remote-files
赞0
踩0