【Hello AI】AIACC-AGSpeed性能数据-阿里云开发者社区

【Hello AI】AIACC-AGSpeed性能数据

2024-01-30 324

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文展示了AIACC-AGSpeed（简称AGSpeed）的部分性能数据，相比较通过PyTorch原生Eager模式训练模型后的性能数据，使用AGSpeed训练多个模型时，性能具有明显提升。

本文展示了AIACC-AGSpeed（简称AGSpeed）的部分性能数据，相比较通过PyTorch原生Eager模式训练模型后的性能数据，使用AGSpeed训练多个模型时，性能具有明显提升。

背景信息

本文通过测试不同场景下的模型，展示AGSpeed的不同性能提升效果。如果您想了解更多模型的性能测试效果，请联系我们。

本示例数据以hf_GPT2、hf_Bert、resnet50，timm_efficientnet等50多个模型为例，通过FP32精度和AMP混合精度两种场景进行训练，不同场景下各模型训练后的性能数据如下所示：

上述性能数据图中，横坐标和纵坐标的含义如下所示：

相比PyTorch原生的Eager模式，通过AGSpeed训练模型后，性能提升率如下所示。以吞吐量作为性能指标来展示AGSpeed的性能效果，性能提升率=（吞吐量（AGSpeed）－吞吐量（Eager））/吞吐量（Eager）。

说明：下图中的数据仅展示部分典型模型，如果您想了解更多模型的性能提升效果，请联系我们。