开发者社区 问答 正文

在流水并行中,如何通过增加batch size来提升收敛加速?

在流水并行中,如何通过增加batch size来提升收敛加速?

展开
收起
萝卜丝丸子 2024-08-05 21:46:54 80 分享 版权
1 条回答
写回答
取消 提交回答
  • 在流水并行中,由于每张卡训练时的显存开销减少,因此可以增大batch size。增大的batch size有助于提升模型的收敛速度,从而加速训练过程。image.png

    2024-08-05 22:33:45
    赞同 1 展开评论
问答地址: