开发者社区 问答 正文

ZeRO具有三个主要的优化阶段分别是?

ZeRO具有三个主要的优化阶段分别是?

展开
收起
游客tbwjb5xynyh2u 2022-05-08 18:06:51 523 分享 版权
来自: 阿里技术
1 条回答
写回答
取消 提交回答
  • 1、优化器状态分区(Pos) :减少了4倍的内存,通信容量与数据并行性相同; 2、增加梯度分区(Pos+g) :8x内存减少,通信容量与数据并行性相同; 3、增加参数分区(Pos+g+p) :内存减少与数据并行度和复杂度成线性关系。

    2022-05-08 18:57:29
    赞同 展开评论
问答地址: