开发者社区 问答 正文

有哪些成熟的分布式训练框架可以解决模型装载和并行的问题?

有哪些成熟的分布式训练框架可以解决模型装载和并行的问题?

展开
收起
夹心789 2024-07-04 12:03:38 57 发布于浙江 分享
分享
版权
举报
2 条回答
写回答
取消 提交回答
  • 分布式训练框架目前已经有比较成熟的方案,比如NVIDIA的Megatron-LM框架、微软开发DeepSpeed ZeRO3的算法,都可以用来解决模型装载和并行的问题。

    image.png

    参考文档https://www.thepaper.cn/newsDetail_forward_27255608

    2024-07-06 09:30:41 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 目前,有一些成熟的分布式训练框架可以解决模型装载和并行的问题,例如NVIDIA开发的Megatron-LM和微软开发的DeepSpeed Zero算法。

    2024-07-04 13:43:23 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论