"https://www.modelscope.cn/models/rgtjf1/multi-modal_gridvlp_classification_chinese-base-ecom-cate-large/summary
请问 modelscope中,这个模型是用大约什么量级的数据训练的呢"
根据提供的链接,该模型是multi-modal_gridvlp_classification_chinese-base-ecom-cate-large
。关于训练数据量级的具体信息我无法直接获取,但通常来说,这类预训练语言模型是通过大规模的文本数据进行训练的。
预训练语言模型的训练通常需要大量的数据以便有效地学习语言知识和模式。一般情况下,这些数据集可能包含从互联网、新闻、社交媒体、书籍等来源收集的数十亿或数百亿个句子。
然而,具体训练数据量取决于模型和训练过程的设计选择,以及可用的计算资源。因此,无法准确确定该模型使用了多少数据来进行训练。
该模型使用了来自电商领域的多模态数据进行训练。一般来说,深度学习模型的性能和训练数据的数量和质量密切相关。为了获得更好的性能,需要使用大量的高质量的训练数据。对于多模态任务,可能需要更多的数据来覆盖不同的数据模态和数据分布。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352