开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

麻烦问一下机器学习PAI中现在epl支持 多机多卡训练吗 我看文档貌似只支持单机多卡

麻烦问一下机器学习PAI中现在epl支持 多机多卡训练吗 我看文档貌似只支持单机多卡

展开
收起
我父亲配享太庙 2023-10-09 12:16:27 63 0
3 条回答
写回答
取消 提交回答
  • 阿里云的机器学习PAI平台自研的分布式训练框架EPL(Easy Parallel Library)目前确实只支持单机多卡的训练模式。这意味着在PAI平台上,你可以在一个机器上运行多个GPU进行训练,但每个GPU都只能在一个CPU上运行。

    2023-10-09 14:03:17
    赞同 展开评论 打赏
  • 阿里云机器学习平台PAI(Machine Learning Platform for AI)目前确实只支持单机多卡训练,不直接支持多机多卡训练。在 PAI 中,你可以使用单个机器上的多块 GPU 卡进行模型训练,以提高训练速度和性能。

    如果你需要进行多机多卡训练,可能需要考虑其他的分布式机器学习框架,例如 TensorFlow、PyTorch 或 Horovod。这些框架提供了灵活的分布式训练功能,可以同时利用多台机器上的多个 GPU 进行训练。

    2023-10-09 13:32:08
    赞同 展开评论 打赏
  • 支持的__此回答整理自钉群“EPL用户交流群”

    2023-10-09 12:32:06
    赞同 展开评论 打赏

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    微博机器学习平台架构和实践 立即下载
    机器学习及人机交互实战 立即下载
    大数据与机器学习支撑的个性化大屏 立即下载