训练失败 报 错怎么办?

训练失败 报 错怎么办? 服务管理

视觉智能开放平台/

生产空间列表/

classify/

训练任务管理/

训练详情

训练详情

名称:

train002

描述:

状态:

训练失败

创建时间:

2023年3月9日 18:44:23

训练耗时:

0小时9分钟11秒

失败原因:

PyTorchJob dlc1ycw45g3eba0s failed because 1 Master replica(s) failed, failed pod contents: {"-1":["dlc1ycw45g3eba0s-master-0"]}

展开
收起
真的很搞笑 2023-03-14 14:48:45 377 分享 版权
2 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,你可以试试换个镜像源?是默认的镜像源访问速度过慢造成的更新和下载失败。

    2023-03-14 18:29:38
    赞同 1 展开评论
  • GitHub https://github.com/co63oc/cloud

    增加数据集测试

    2023-03-14 17:47:18
    赞同 展开评论
问答分类:
问答地址:

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

收录在圈子:
阿里云视觉智能开放平台视觉AI能力问题咨询,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群

热门讨论

热门文章

还有其他疑问?
咨询AI助理