带你读《阿里云产品六月刊》——四、阿里云HPC优化实例hpc8ae正式商业化

简介: 阿里云HPC优化实例hpc8ae正式商业化

简介: 近日,全球领先的云计算厂商阿里云宣布正式开启最新HPC优化实例hpc8ae 的商业化发布,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代 AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE 场景下的性价比最少提升 50%。

 

近日,全球领先的云计算厂商阿里云宣布正式开启最新HPC优化实例hpc8ae 的商业化发布,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代 AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE 场景下的性价比最少提升 50%。

 

从分析地震资料勘探石油储藏,到使用计算流体力学设计汽车外形降低风阻,再到通过分子动力学模拟来发现新的药物靶点、攻克疾病。过去很多年,高性能计算无所不在,在各个领域,都在帮助我们解决各种各样、大型的、复杂的计算问题,促进社会的技术进步和创新发展。传统高性能计算和人工智能、VR、5G 等新兴领域的爆发式发展,对算力的需求越来越高。

 

传统的线下HPC存在建设周期长、计算资源不足和性能落后等诸多问题,难以满足企业的研发创新需求。基于云计算的 Cloud HPC,更加敏捷,能够使用最新的、多样性化的硬件,灵活的按照业务动态的增加或减少资源,更具成本效益。

 

阿里云高性能计算产品负责人黄泽辉表示:“阿里云一直以来,坚定地投入 Cloud HPC 方向,不断的革新计算技术,为 HPC 应用负载专门设计和优化云的基础设施,并通过端到端的 HPCaaS 云产品帮助任意规模的用户,以最简单的方式,来使用最强大的高性能计算。本次 hpc8ae 实例的发布,代表着阿里云在普惠高性能的 Cloud HPC 路上更进一步,为行业客户不断的降本增效。”

 

image.png

 

image.png

image.png

 

算力强劲,CAE 场景算力的最佳选择

HPC优化实例hpc8ae针对高性能计算应用进行了深度优化。在关键参数上,hpc8ae实例最高主频 3.75Ghz、内存带宽500GB/s ,提供了更加稳定的物理核心,不支持启用超线程。通过阿里云自研的CIPU 架构将算力损耗降为“0”,存储的 I/O 性能、实例的网络能力都全面提升, HPC 、通用计算、大数据、AI 等场景都能从中获得 20%以上的性能提升。

image.png

图:hpc8ae实例的 benchmark 性能测试

 

在 WRF、STAR-CCM+、Fluent 等常见工业仿真软件的性能benchmark 测试中,相较于第八代通用计算实例,专门优化的 hpc8ae实例在单节点作业中性能普遍提升 30%以上;在超过 512 核的多节点作业中,STAR-CCM+的计算扩展效率也接近线性,具有很好的并行加速效果。

基于eRDMA网络,打造云上低延时、低抖动网络集群

众所周知,HPC 类应用对于网络的性能需求(如延迟、吞吐)很高,TCP/IP的网络通信性能成为瓶颈,而传统 HPC 集群更多采用 RDMA 网络成本很高,弹性和扩展能力不足。阿里云的eRDMA、是阿里云自研云上弹性RDMA网络,底层链路复用VPC网络,支持 0 拷贝、bypass 操作系统,采用自研的拥塞控制算法,并通过 CIPU 卸载网络通信开销,可实现最低 8μs 的低时延、没有长尾抖动的节点网络通信效果。对于用户的HPC软件应用,eRDMA 通过支持libfabric 实现兼容,用户无需改动即可直接使用。

 

image.png

 

因此,用户可以在阿里云任意可用区,即可实现秒级大规模的RDMA 组网,加速并行计算任务。阿里云 ECS 还提供部署集的能力,保证同一部署集内的 hpc8ae 实例紧凑放置,可以进一步提升 eRDMA 的低时延表现。

 

E-HPC 一键开启云上仿真任务

 

此外,阿里云还为客户提供了功能完善的弹性高性能计算服务 E-HPC,客户可一键创建 HPC 集群,通过最高效的集群管理功能,以最简单易用的方式来使用 hpc8ae 实例进行云上仿真任务,包括使用 SLURM、PBS 等常用的调度器,管理和监控 HPC 作业,自动化的安装和部署软件、使用部署集的能力保证时延等,以提高计算效率,优化计算成本。

 

目前,阿里云E-HPC弹性高性能计算平台已助力众多企业企业缩短研发周期,加快业务创新。其中,帮助上汽乘用车制造仿真效率提升30%,支撑某手机厂商仿真业务性能提升25%。


目录
相关文章
|
8月前
|
弹性计算 Kubernetes 负载均衡
ECS:云原生计算的新篇章
ECS:云原生计算的新篇章
|
20天前
|
存储 弹性计算 人工智能
弹性计算第九代企业级ECS实例新品发布
阿里云第九代企业级实例基于全新CIPU 2.0架构,搭载最新英特尔和AMD处理器,大幅提升性能、安全性和稳定性。G9i实例采用英特尔新一代处理器,内存带宽和L3缓存显著提升,标配AMX加速器;G9A实例则搭载AMD先进处理器,提供更高的性价比和端到端加密能力。九代产品在算力、IO能力和安全性上全面升级,尤其适用于搜推、大数据处理等场景,助力客户实现更高业务价值。
|
2月前
|
弹性计算 大数据 双11
阿里云ECS“99套餐”再升级!双11一站式满足全年算力需求
弹性计算双11爆款清单来袭,感恩回馈好礼,优惠惊喜不断!
|
4月前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
115 13
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
8月前
|
弹性计算 运维 监控
【阿里云弹性计算】从物理机到阿里云ECS:企业IT架构转型升级之路
【5月更文挑战第29天】随着云计算兴起,企业正转向阿里云ECS以应对传统物理机的挑战。本文详述了这一转型过程,包括现状评估、迁移计划制定、测试环境搭建、应用数据迁移及后期监控优化。转型升级可提升资源利用率,降低运维成本,加快业务响应,并增强数据安全。示例代码展示了使用阿里云Python SDK创建ECS实例的过程。
218 1
|
8月前
|
存储 弹性计算 监控
【阿里云弹性计算】阿里云ECS全面解析:弹性计算服务的核心优势与应用场景
【5月更文挑战第20天】阿里云ECS是提供可伸缩计算能力的云服务,支持多种规格实例,满足不同需求。其核心优势包括灵活性、高性能、高可用性、安全性和易用性。适用场景包括网站托管、大数据处理、游戏多媒体应用及测试开发环境。通过Python示例代码展示了如何创建ECS实例,助力企业专注业务发展,简化基础设施管理。
241 5
|
8月前
|
弹性计算 监控 数据库
【阿里云弹性计算】企业级应用上云实战:基于阿里云 ECS 的 ERP 系统迁移案例
【5月更文挑战第25天】制造企业将面临资源不足、维护成本高和数据安全问题的ERP系统迁移到阿里云ECS,实现业务上云。通过数据迁移、应用部署、网络配置和性能优化等步骤,企业享受到弹性计算资源、高可靠性和数据安全优势,降低维护成本。阿里云提供24小时支持,助力企业数字化转型。此案例展示企业级应用上云的可行性,鼓励更多企业借助云计算实现创新发展。
179 0
|
弹性计算 应用服务中间件 网络安全
企业级ECS集群构建实践
本实验向您介绍了如何使用ROS模板来创建并部署一个Linux+PHP+MYSQL的应用环境,其中创建的云资源包括基础网络资源VPC和VSwitch、基础弹性计算资源ECS,并通过传统负载均衡CLB提供应用的高可用能力。
企业级ECS集群构建实践
|
存储 弹性计算 运维
弹性计算Clouder认证:ECS基础运维管理—课时5:如何进行实例管理
弹性计算Clouder认证:ECS基础运维管理—课时5:如何进行实例管理
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——配置
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——配置自制脑图
150 2