热门
GPT-3(2.7B)模型,基于ModelScope中提供的checkpoint在用户自有的数据集上做继续训练,或是重新输出化参数进行训练,这是在GPU上跑起来,如果是用4卡V100的跑3万条自己的数据,需要跑多久?
modelcard里提供的代码是基于2.7B的checkpoint continue train的,训练时间主要取决于数据的长度和数量,如果长度短的话,4卡v100训练速度应该还是挺快的——该回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域