基于ModelScope中提供checkpoint在用户数据集上做训练,需要跑多久?

GPT-3(2.7B)模型,基于ModelScope中提供的checkpoint在用户自有的数据集上做继续训练,或是重新输出化参数进行训练,这是在GPU上跑起来,如果是用4卡V100的跑3万条自己的数据,需要跑多久?

展开
收起
鸡蛋灌饼儿 2023-02-12 15:45:28 563 分享 版权
1 条回答
写回答
取消 提交回答
  • modelcard里提供的代码是基于2.7B的checkpoint continue train的,训练时间主要取决于数据的长度和数量,如果长度短的话,4卡v100训练速度应该还是挺快的——该回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-02-12 19:50:47
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

收录在圈子:
+ 订阅

热门讨论

热门文章

还有其他疑问?
咨询AI助理