ModelScope中单机2卡和多机2卡都报下面的错误,单机1卡则能跑通 麻烦验证下看看是什么问题

ModelScope中d48985bc78ee394f65eca7609840effd.png跑adaseq bert-crf例子(https://github.com/modelscope/AdaSeq/blob/master/examples/bert_crf/configs/maoe_example.yaml)

环境:torch1.11.0,modelscope1.8.4,adaseq0.6.4

单机2卡命令:python -m torch.distributed.launch --nproc_per_node=2--master_port=29527 scripts/train.py -c $config

异常:单机2卡和多机2卡都报下面的错误,单机1卡则能跑通

麻烦验证下

展开
收起
超爱吃辣 2023-09-26 22:09:17 112 分享 版权
1 条回答
写回答
取消 提交回答

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理