阿里云高性能计算是的阿里云服务器ECS的架构之一,高性能计算实例规格族主要应用于各种需要超高性能、网络和存储能力的应用场景,例如人工智能、机器学习、科学计算、地质勘探、气象预报等场景。高性能计算实例规格族有高性能计算优化型实例规格族hpc8ae、高性能计算优化型实例规格族hpc7ip、计算型超级计算集群实例规格族sccc7等。下面是阿里云高性能计算实例规格族特点、适用场景介绍。
一、阿里云高性能计算实例规格族有哪些?
目前高性能计算实例规格族的云服务器有10个实例规格,实例名称如下:
- 高性能计算优化型实例规格族hpc8ae
- 高性能计算优化型实例规格族hpc7ip
- 高性能计算优化型实例规格族hpc6id
- 通用型超级计算集群实例规格族sccg7
- 计算型超级计算集群实例规格族sccc7
- 高主频计算型超级计算集群实例规格族scchfc6
- 高主频通用型超级计算集群实例规格族scchfg6
- 高主频内存型超级计算集群实例规格族scchfr6
- 高主频型超级计算集群实例规格族scch5
- GPU计算型超级计算集群实例规格族sccgn7ex
架构特点:高性能计算在弹性裸金属服务器基础上,加入高速RDMA(Remote Direct Memory Access)互联支持,大幅提升网络性能,提高大规模集群加速比。在提供高带宽、低延迟优质网络的同时,还具备弹性裸金属服务器的所有优点。
适用场景:主要用于高性能计算和人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用场景。可以满足超高性能、网络和存储能力的要求。
二、高性能计算优化型实例规格族hpc8ae实例特点、适用场景
1、hpc8ae实例的特点如下:
hpc8ae实例专为工业仿真、EDA(Electronic Design Automation)仿真、地质勘探、气象预报、分子动力学模拟等计算和网络密集的紧密耦合的HPC工作负载而设计。提供高达3.75 GHz的最新的第四代EPYC™(Genoa)处理器、64 Gbps的eRDMA节点间网络带宽以及增强的内存带宽能力。
计算:
处理器与内存配比为1:4
处理器:3.4 GHz主频的AMD EPYCTM Genoa处理器,单核睿频最高3.75 GHz,计算性能稳定
不支持开启超线程配置存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘网络:
支持IPv4、IPv6
支持ERI(Elastic RDMA Interface)
与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。
2、hpc8ae实例适用场景:
- 工业仿真中计算流体动力学(Computational Fluid Dynamics,CFD)、有限元分析(Finite Element Analysis,FEA)
- EDA仿真
- 地质勘探
- 气象预报
- 分子动力学模拟
- 其他高性能计算场景
3、hpc8ae实例包括的实例规格及指标数据
实例规格 | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | eRDMA网络(Gbit/s) |
---|---|---|---|---|
ecs.hpc8ae.32xlarge | 64 | 256 | 64 | 64 |
三、高性能计算优化型实例规格族hpc7ip实例特点、适用场景
1、hpc7ip实例的特点如下:
hpc7ip专为芯片设计等需要大量内存容量的HPC工作负载而设计。依托第三代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。提供高达1:32的超大处理器与内存配比,搭配Intel傲腾持久内存介质,极大幅度降低内存型应用单GiB内存的成本。
计算:
处理器与内存(内存+持久内存)配比约为1:32。
处理器:采用第三代Intel® Xeon®可扩展处理器(Ice Lake),基频2.7 GHz,全核睿频3.5 GHz,计算性能稳定。
不支持开启超线程配置。存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘网络:
支持IPv4、IPv6
超高网络收发包PPS能力
与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。
2、hpc7ip实例适用场景:
- 芯片设计
- 其他高性能计算场景
3、hpc7ip实例规格及指标数据
实例规格 | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) |
---|---|---|---|
ecs.hpc7ip.32xlarge | 64 | 2048 | 64 |
四、高性能计算优化型实例规格族hpc6id实例特点、适用场景
1、hpc6id实例的特点如下:
hpc6id专为芯片设计等需要大量内存容量和本地数据访问的HPC工作负载而设计。依托第三代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。提供超大内存和2块3.8 TB本地数据盘,降低内存和数据受限应用的使用成本。
计算:
处理器与内存配比约为1:38
处理器:Intel® Xeon®可扩展处理器(Cascade Lake),基频 3.1 GHz,全核睿频3.5 GHz,计算性能稳定
不支持开启超线程配置存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘
- 网络:
支持IPv4、IPv6
超高网络收发包PPS能力
与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。
2、hpc6id实例适用场景:
- 芯片设计
- 地震油藏和结构模拟
- 其他高性能计算场景
3、hpc6id实例规格及指标数据
实例规格 | 物理内核 | 内存(GiB) | 本地存储(GB) | 网络带宽(Gbit/s) |
---|---|---|---|---|
ecs.hpc6id.20xlarge | 40 | 1536 | 2 * 3840 | 32 |
五、通用型超级计算集群实例规格族sccg7实例特点、适用场景
1、sccg7实例的特点如下:
- 计算:
处理器与内存配比为1:4
处理器:2.9 GHz主频的Intel ® Xeon ® Platinum 8369(Ice lake),全核睿频3.5 GHz
- 存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘
- 网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、sccg7实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、sccg7实例包括的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IPv4地址数 | 单网卡IPv6地址数 |
---|---|---|---|---|---|---|---|---|---|---|
ecs.sccg7.32xlarge | 128 | 64 | 512 | 100 | 2400万 | 200 | 8 | 32 | 10 | 10 |
六、计算型超级计算集群实例规格族sccc7实例特点、适用场景
1、sccc7实例的特点如下:
计算:
处理器与内存配比为1:2
处理器:2.9 GHz主频的Intel ® Xeon ® Platinum 8369(Ice lake),全核睿频3.5 GHz存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、sccc7实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、sccc7实例的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IPv4地址数 | 单网卡IPv6地址数 |
---|---|---|---|---|---|---|---|---|---|---|
ecs.sccc7.32xlarge | 128 | 64 | 256 | 100 | 2400万 | 200 | 8 | 32 | 10 | 10 |
七、高主频计算型超级计算集群实例规格族scchfc6实例特点、适用场景
1、scchfc6实例的特点如下:
计算:
处理器与内存配比为1:2.4
处理器:3.1 GHz主频的Intel ® Xeon ® Platinum 8269(Cascade Lake),全核睿频3.5 GHz存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、scchfc6实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、scchfc6实例的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IP |
---|---|---|---|---|---|---|---|---|---|
ecs.scchfc6.20xlarge | 80 | 40 | 192 | 30 | 600万 | 50 | 8 | 32 | 10 |
八、高主频通用型超级计算集群实例规格族scchfg6实例特点、适用场景
1、scchfg6实例的特点如下:
计算:
处理器与内存配比为1:4.8
处理器:3.1 GHz主频的Intel ® Xeon ® Platinum 8269(Cascade Lake),全核睿频3.5 GHz存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、scchfg6实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、scchfg6实例的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IP |
---|---|---|---|---|---|---|---|---|---|
ecs.scchfg6.20xlarge | 80 | 40 | 384 | 30 | 600万 | 50 | 8 | 32 | 10 |
九、高主频内存型超级计算集群实例规格族scchfr6实例特点、适用场景
1、scchfr6实例的特点如下:
计算:
处理器与内存配比为1:9.6
处理器:3.1 GHz主频的Intel ® Xeon ® Platinum 8269(Cascade Lake),全核睿频3.5 GHz存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、scchfr6实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、scchfr6实例的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IP |
---|---|---|---|---|---|---|---|---|---|
ecs.scchfr6.20xlarge | 80 | 40 | 768 | 30 | 600万 | 50 | 8 | 32 | 10 |
十、高主频型超级计算集群实例规格族scch5实例特点、适用场景
1、scch5实例的特点如下:
计算:
处理器与内存配比为1:3
处理器:3.1 GHz主频的Intel ® Xeon ® Gold 6149(Skylake)存储:
均为I/O优化实例
仅支持SSD云盘和高效云盘网络:
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
2、scch5实例适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
3、scch5实例的实例规格及指标数据
实例规格 | vCPU | 物理内核 | 内存(GiB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列 | 弹性网卡 | 单网卡私有IP |
---|---|---|---|---|---|---|---|---|---|
ecs.scch5.16xlarge | 64 | 32 | 192 | 10 | 450万 | 50 | 8 | 32 | 10 |
十一、GPU计算型超级计算集群实例规格族sccgn7ex实例特点、适用场景
1、sccgn7ex实例的特点如下:
sccgn7ex是阿里云为了面对日益增长的大规模AI训练需求开发的高带宽超算集群实例。多台裸金属服务器之间采用第三代RDMA SCC网络互联,支持800 G的互联带宽。您可以根据训练需求弹性选择线上集群数量,快速满足大规模AI参数训练的需求。
计算:
支持NVSwitch,算力高达312T(TF32)
处理器与内存配比为1:8
处理器:采用第三代Intel ® Xeon ® 8369可扩展处理器(Ice lake),基频2.9 GHz,全核睿频3.5 GHz,支持PCIe 4.0接口存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘网络:
支持IPv6
仅支持专有网络VPC
超高网络性能,2400万PPS网络收发包能力
sccgn7ex实例间支持800 Gbit/s的互联带宽(4 * 双口100 Gbit/s RDMA),支持GPUDirect,每颗GPU直连一个100 Gbit/s网口
2、sccgn7ex实例适用场景:
超大规模AI训练场景
3、sccgn7ex实例的实例规格及指标数据
实例规格 | vCPU | 内存(GiB) | GPU显存(GB) | 网络带宽(Gbit/s) | 网络收发包PPS | RoCE网络(Gbit/s) | 多队列(主网卡/辅助网卡) | 弹性网卡 | 单网卡私有IPv4地址数 | 单网卡IPv6地址数 |
---|---|---|---|---|---|---|---|---|---|---|
ecs.sccgn7ex.32xlarge | 128 | 1024 | 80 GB * 8 | 64 | 2400万 | 800 | Dec-32 | 32 | 15 | 15 |
以上就是目前阿里云所有云服务器实例规格中属于高性能计算的实例规格族,以及它们各自特点、适用场景介绍,通过了解它们的性能、特点及适用场景,再根据自己的业务需求,从而选择适合自己的高性能计算的实例规格族。购买之前建议先了解一下当下是否有优惠券或者代金券可以领取,阿里云官方会不定期通过云小站平台等地址推出满减代金券,如果有的话,先领券再购买,价格可以在优惠价格基础上进一步优惠。学生和教师用户可关注一下阿里云权益中心,学生用户可领取300元无门槛优惠券,合作高校教师可获得5折起专属权益。