老师好我刚接触ModelScope这个,我想知道
,如果我很多image文件和text描述,这里怎么改啊?我看没有读取文件然后对文件里的image和text获取,我没看源码,这是单条微调训练方式嘛?
每条 image 文件和 text 描述内容可以不同,但在数据集中的 key 应该是统一的,比如一个简单的数据集:
Dataset({
features: ['image', 'query'],
num_rows: 100 })
包含两个 key(对应 column_map),您只需要将自己的数据集中的 features 与 clip trainer 需要的 img 和 text 对应即可,多个数据集是来自多个不同的文件吗?可以通过 MsDataset.load 的 data_files 参数加载,详见 https://modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97#2.%20%E5%8A%A0%E8%BD%BD%E5%A4%9A%E4%B8%AA%E6%96%87%E4%BB%B6
,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352