【Hello AI】AIACC-ACSpeed性能数据

简介: 本文展示了AIACC-ACSpeed的部分性能数据,相比较通过原生DDP训练模型后的性能数据,使用AIACC-ACSpeed训练多个模型时,性能具有明显提升。

本文展示了AIACC-ACSpeed的部分性能数据,相比较通过原生DDP训练模型后的性能数据,使用AIACC-ACSpeed训练多个模型时,性能具有明显提升。

背景信息

本文以AIACC-ACSpeed(简称ACSpeed)v1.0.2版本在阿里云某8卡机器上的多机性能数据为例,通过测试不同场景下的模型,展示ACSpeed的不同性能提升效果。如果您想了解更多机型性能测试效果,请联系我们

测试版本

  • ACSpeed版本:1.0.2
  • Cuda版本:11.1
  • torch版本:1.8.1+cu111
  • 实例类型:某8卡实例

性能效果

ACSpeed在多个模型下均有相应性能提升效果,整体有5%~200%的性能增益。通过测试ACSpeed训练多个模型后的性能效果,可以看到原生DDP的扩展性(即多机线性度)不佳时,ACSpeed的提升效果越明显,且ACSpeed不会出现性能回退的现象,性能效果展示如下图所示。

涉及的主要概念如下所示:

概念

说明

ddp_acc(横坐标)

表示PyTorch原生分布式DDP的多机多卡的扩展性。

多机多卡扩展性:即多机线性度=多机性能/单机性能/集群数,数值越低扩展性越差。

acc_ratio(纵坐标)

表示ACSpeed相对于原生DDP的性能指标的提升比值。例如,1.25表示ACSpeed的性能是原生DDP性能的1.25倍,即性能提升25%。

圆点

表示具体的某个模型配置的DDP的原生性能和ACSpeed的加速效果,不同颜色表示不同集群规模。

  • 蓝色圆点:表示集群数量为1。
  • 橙色圆点:表示集群数量为2。
  • 红色圆点:表示集群数量为4。
  • 绿色圆点:表示集群数量为8。

典型模型性能数据

本节仅展示了部分已测试的典型模型的性能数据信息。不同场景下的模型,通信计算的占比不同也会导致端到端的性能提升有所差异。如果您需要了解更多测试模型的性能数据,请联系我们。具体测试模型的性能数据如下:

  • 场景1:训练alexnet模型
  • Model:alexnet
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:128
  • Precision:amp

该场景下的alexnet模型训练后的性能数据如下所示:

  • 场景2:训练resnet18模型
  • Model:resnet18
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:16
  • Precision:amp

该场景下的resnet18模型训练后的性能数据如下所示:

  • 场景3:训练resnet50模型
  • Model:resnet50
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:32
  • Precision:amp

该场景下的resnet50模型训练后的性能数据如下所示:

  • 场景4:训练vgg16模型
  • Model:vgg16
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:64
  • Precision:amp

该场景下的vgg16模型训练后的性能数据如下所示:

  • 场景5:训练timm_vovnet模型
  • Model:timm_vovnet
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:32
  • Precision:amp

该场景下的timm_vovnet模型训练后的性能数据如下所示:

  • 场景6:训练timm_vision_transformer模型
  • Model:timm_vision_transformer
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:8
  • Precision:amp

该场景下的timm_vision_transformer模型训练后的性能数据如下所示:

  • 场景7:训练pytorch_unet模型
  • Model:pytorch_unet
  • Domain:COMPUTER_VISION
  • Subdomain:CLASSIFICATION
  • Batch_size:1
  • Precision:amp

该场景下的pytorch_unet模型训练后的性能数据如下所示:

  • 场景8:训练hf_Bart模型
  • Model:hf_Bart
  • Domain:NLP
  • Subdomain:LANGUAGE_MODELING
  • Batch_size:4
  • Precision:amp

该场景下的hf_Bart模型训练后的性能数据如下所示:

  • 场景9:训练hf_Bert模型
  • Model:hf_Bert
  • Domain:NLP
  • Subdomain:LANGUAGE_MODELING
  • Batch_size:4
  • Precision:amp

该场景下的hf_Bert模型训练后的性能数据如下所示:

  • 场景10:训练speech_transformer模型
  • Model:speech_transformer
  • Domain:SPEECH
  • Subdomain:RECOGNITION
  • Batch_size:32
  • Precision:amp

该场景下的speech_transformer模型训练后的性能数据如下所示:

  • 场景11:训练tts_angular模型
  • Model:tts_angular
  • Domain:SPEECH
  • Subdomain:SYNTHESIS
  • Batch_size:64
  • Precision:amp

该场景下的tts_angular模型训练后的性能数据如下所示:

好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8

【扫码填写上方调研问卷】

欢迎每位来到弹性计算的开发者们来反馈问题哦~

相关文章
|
3月前
|
消息中间件 人工智能 Kafka
AI 时代的数据通道:云消息队列 Kafka 的演进与实践
云消息队列 Kafka 版通过在架构创新、性能优化与生态融合等方面的突破性进展,为企业构建实时数据驱动的应用提供了坚实支撑,持续赋能客户业务创新。
448 37
|
4月前
|
消息中间件 人工智能 运维
事件驱动重塑 AI 数据链路:阿里云 EventBridge 发布 AI ETL 新范式
“一个简单的数据集成任务,开始时总是轻松愉快的,但随着业务扩展,数据源越来越多,格式越来越乱,整个数据链路就会变得一团糟。”陈涛在演讲中指出了当前 AI 数据处理的普遍困境。扩展难、运维难、稳定性差,这三大挑战已成为制约 AI 应用创新和落地的关键瓶颈。针对这些痛点,在2025云栖大会期间,阿里云重磅发布了事件驱动 AI ETL 新范式,其核心产品 EventBridge 通过深度集成 AI 能力,为开发者提供了一套革命性的解决方案,旨在彻底改变 AI 时代的数据准备与处理方式。
451 41
|
3月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
4421 69
|
3月前
|
机器学习/深度学习 人工智能 监控
拔俗AI智能营运分析助手软件系统:企业决策的"数据军师",让经营从"拍脑袋"变"精准导航"
AI智能营运分析助手打破数据孤岛,实时整合ERP、CRM等系统数据,自动生成报表、智能预警与可视化决策建议,助力企业从“经验驱动”迈向“数据驱动”,提升决策效率,降低运营成本,精准把握市场先机。(238字)
|
3月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
3月前
|
机器学习/深度学习 人工智能 算法
拔俗AI智能营运分析助手:用技术破解企业“数据焦虑”
AI智能营运分析助手破解企业“数据多却难洞察”难题,通过自动化集成、定制化模型、可视化输出,助力中小企业实现低门槛数据驱动决策,提升营运效率与精准度。
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
拔俗AI体征营养指导系统:从数据到建议的技术闭环
AI如何读懂身体并给出科学营养建议?本文从开发者视角揭秘三大核心技术:多源异构数据融合,构建个性化推荐引擎,以及反馈驱动的持续学习系统。通过打通“感知-决策-反馈”闭环,AI真正实现千人千面的动态营养指导,成为可进化的健康伙伴。(238字)
|
3月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
735 49
|
4月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1037 55
|
3月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
503 30

热门文章

最新文章