开发者社区 问答 正文

在T5模型上,EPL通过哪些显存优化技术的组合使用,实现了显存的极致优化?

在T5模型上,EPL通过哪些显存优化技术的组合使用,实现了显存的极致优化?

展开
收起
萝卜丝丸子 2024-08-05 21:46:54 59 分享 版权
1 条回答
写回答
取消 提交回答
  • 在T5模型上,EPL通过开启GC(Gradient Checkpoint)、ZeRO和显存优化的AMP技术的组合使用,实现了显存的极致优化。在性能保持不变的情况下,显存降低了2.6倍。

    2024-08-05 22:09:01
    赞同 6 展开评论
问答地址: