麻烦问一下机器学习PAI中现在epl支持 多机多卡训练吗 我看文档貌似只支持单机多卡

麻烦问一下机器学习PAI中现在epl支持 多机多卡训练吗 我看文档貌似只支持单机多卡

展开
收起
我父亲配享太庙 2023-10-09 12:16:27 102 发布于吉林 分享
分享
版权
举报
3 条回答
写回答
取消 提交回答
  • 阿里云的机器学习PAI平台自研的分布式训练框架EPL(Easy Parallel Library)目前确实只支持单机多卡的训练模式。这意味着在PAI平台上,你可以在一个机器上运行多个GPU进行训练,但每个GPU都只能在一个CPU上运行。

    2023-10-09 14:03:17 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 阿里云机器学习平台PAI(Machine Learning Platform for AI)目前确实只支持单机多卡训练,不直接支持多机多卡训练。在 PAI 中,你可以使用单个机器上的多块 GPU 卡进行模型训练,以提高训练速度和性能。

    如果你需要进行多机多卡训练,可能需要考虑其他的分布式机器学习框架,例如 TensorFlow、PyTorch 或 Horovod。这些框架提供了灵活的分布式训练功能,可以同时利用多台机器上的多个 GPU 进行训练。

    2023-10-09 13:32:08 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 支持的__此回答整理自钉群“EPL用户交流群”

    2023-10-09 12:32:06 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

热门讨论

热门文章

还有其他疑问?
咨询AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等