请教clip finetune demo里的muge数据集的格式手机怎么样的。怎么使用自定义数据集进行finetune
牧歌数据参见官方网站:https://tianchi.aliyun.com/muge 自定义数据集可以自己收集图文pair,然后利用huggingface datasets的csv接口处理local数据。 例如组织好了文件是train.txt,内容样例为 query\timage 1\timage_path_1 2\timage_path_2 ... dataset = load_dataset('csv', data_files='train.txt', sep='\t')['train'] dataset即为hf的dataset。而modelscope的msdataset支持hf dataset 更多dataset的使用可以参考:https://huggingface.co/docs/datasets/loading#local-and-remote-files
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352