基于 megatron V3 训练的模型有2.45G,你们能不能,或者教下我把这个模型拆分下?

基于 megatron V3 训练的模型有2.45G,你们能不能,或者教下我把这个模型拆分下?推理用,后期也要二次训练

展开
收起
真的很搞笑 2023-03-02 22:51:59 214 分享 版权
1 条回答
写回答
取消 提交回答
  • 在 configuration.json 文件中添加正确的 world_size,并指定 checkpoint_model_parallel_size 为 1,pipeline 推理过程就会自动拆分模型,类似这样: { ... "model": { "world_size": 8, "checkpoint_model_parallel_size": 1 }, ... },此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-03-02 23:02:57
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

收录在圈子:
+ 订阅

热门讨论

热门文章

还有其他疑问?
咨询AI助理