gpt-3(1.3B)的预训练模型我加载到magatron-lm V3能加载进去进行推理吗?
是用这个repo吗,我们是用的GPT的架构,理论上是可以的。但是我们也没有专门去做过验证。推理的话16G应该够了 训练要32G,key有点不一样,模型离线导入到/root/~/.cache/modelscope/hub/damo下面了对应的文件夹里了,但是运行Model.from_pretrained的时候,还是会进行下载(主要是服务器上下载比较慢才从其他电脑下载好导入的),请问这个怎么解决,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”