文档备案控制台

开发者社区问答正文

如何创建和使用SCC集群?

如何创建和使用SCC集群?

展开

收起

小天使爱美 2020-03-23 19:30:15 1507 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小天使爱美

SCC（超级计算集群）简介 SCC概述超级计算集群（Super Computing Cluster，SCC）使用高速RDMA网络互联的CPU以及GPU等异构加速设备，面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用，提供极致计算性能和并行效率的计算集群服务。

SCC实例类型类型 CPU Memory 网络存储适用场景 ecs.scch5.16xlarge 64核 Skylake Xeon Gold 6149 3.1GHz 192GB 50 Gbps RDMA 高效云盘（容量可选） + SSD云盘（容量可选） CPU主频高，单核计算能力强，适用于多数计算密集型应用场景 ecs.sccg5.24xlarge 96核 Skylake Xeon Platinum 8163 2.5GHz 384GB 50 Gbps RDMA 高效云盘（容量可选） + SSD云盘（容量可选） CPU核数多，内存容量大，适用于内存需求较高、扩展性好的科学计算场景以及高并发的批处理场景使用SCC实例创建E-HPC集群创建过程目前配备有SCC实例的可用区主要有：华东1可用区H、华东2可用区B、华北1可用区C、华北3可用区A。考虑到库存的变化，用户在创建集群之前可以通过ECS管理控制台查看SCC实例在不同可用区的分布情况。从E-HPC管理控制台进入集群创建页面，在计算节点下划栏中勾选SCC实例。勾选SCC注意：上图中SCC实例的CPU核数是按照vCPU数目来显示的，而实际交付的SCC实例为超线程关闭（HT off）状态，即scch5.16xlarge和sccg5.24xlarge的CPU核数分别为32物理核和48物理核。

后续创建过程请参考E-HPC集群创建与配置硬件信息相比于普通ECS实例，SCC实例的核心硬件升级之一在于配备了50Gbps的RoCE(RDMA over Converged Ethernet)网络，故网络信息与普通ECS实例相比有明显差异。

网络硬件信息相比于普通ECS实例，SCC实例同时拥有10Gbps VPC网络和50Gbps RoCE网络的网口，因此在会ECS管理控制台上会同时显示两个IP地址。 SCC IP

正常的SCC实例会显示如下网口信息，其中bond0为RoCE网口，eth0为VPC网口。 SCC网口信息

网络连通性验证同一个E-HPC集群下的SCC实例间的VPC网络IP和RoCE网络IP均可以相互ping通同一个E-HPC集群下的SCC实例间可以通过VPC网络IP和RoCE网络IP进行ssh登陆 RoCE网络性能测试测试RoCE网络的峰值带宽与延迟带宽测试样例 ##读带宽测试 ib_read_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_read_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 ##写带宽测试 ib_write_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_write_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行延迟测试样例 ##读延迟测试 ib_read_lat -a ##服务端compute0执行 ib_read_lat -F -a compute0 ##用户端compute1执行 ##写延迟测试 ib_write_lat -a ##服务端compute0执行 ib_write_lat -F -a compute0 ##用户端compute1执行监测RoCE网络的实际带宽利用情况在SCC实例root用户下执行rdma_monitor -s实时获取RoCE网络信息 rdma_monitor

使用E-HPC性能监控与分析引擎集谛来监测各SCC实例RoCE网络带宽随时间的变化情况。集谛监测RoCE

在SCC集群上编译和运行MPI程序由于SCC实例同时支持50Gbps RoCE网络和10Gbps VPC网络，用户在执行跨节点MPI程序时可能会遇到节点间数据流量默认走VPC网口的情况，这里我们推荐用户在SCC集群上使用IntelMPI来编译和运行跨节点MPI程序。

编译跨节点MPI程序安装IntelMPI E-HPC集成了IntelMPI 2018版本，用户只需在E-HPC控制台集群创建或软件管理功能界面中勾选IntelMPI 2018进行安装即可。

intelmpi

配置MPI环境变量方法一：使用E-HPC集成的Module管理工具 $ module avail --------------------------------- /opt/ehpcmodulefiles -------------------------------- intel-mpi/2018 $ module load intel-mpi/2018 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 方法二：执行IntelMPI自带的环境变量配置脚本 $ source /opt/intel/compilers_and_libraries/linux/bin/compilervars.sh intel64 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 设置MPI编译参数完成MPI环境变量配置后，需要在软件Makefile或预编译脚本中指定MPI编译器的相对/绝对路径，然后执行编译过程。

-DCMAKE_C_COMPILER=mpicc -DCMAKE_CXX_COMPILER=mpicxx 运行跨节点MPI程序对于在E-HPC软件环境中采用IntelMPI编译的软件，提交任务时无需额外指定网口参数，便可以直接通过RoCE网络进行跨节点数据通信。 #!/bin/sh #PBS -j oe #PBS -l select=<节点数>:ncpus=<每节点核数>:mpiprocs=<每个节点进程数> module load intel-mpi/2018 mpirun <软件执行命令> 对于在用户本地环境编译的软件或预编译的商用软件，可以在提交MPI任务时指定RoCE网卡信息来避免可能出现的数据流量不走RoCE网络或网卡设备not found等问题。 #!/bin/sh #PBS -j oe #PBS -l select=<节点数>:ncpus=<每节点核数>:mpiprocs=<每个节点进程数> export I_MPI_FABRICS=shm:dapl module load intel-mpi/2018 mpirun -genv I_MPI_DAPL_PROVIDER ofa-v2-mlx5_bond_0 <软件执行命令> 用户可以使用集谛性能监测功能对SCC实例的CPU利用率、访存带宽、RoCE网络带宽等性能数据进行实时监测。 SCC性能

2020-03-24 09:49:57

赞同展开评论

问答分类：

超级计算集群

问答标签：

超级计算集群集群

问答地址：

开发者社区 > 云计算 > 问答

相关问答

请问怎么用E-HPC创建SCC集群呢？

1593

6

0

阿里云还在飞天专有云输出了基于 Apsara Stack 企业版和敏捷版的 SCC 专有云集群有何

1306

1

0

高性能计算集群的软件系统是什么？

842

1

0

如何使用E-HPC创建SCC集群？

588

1

0

高性能计算(High Performance Computing，HPC)是什么？

921

1

0

什么是高性能计算HPC？

2697

1

0

高性能计算（Alibaba Cloud HPC）是什么？

18672

0

0

高性能计算（Alibaba Cloud HPC）有自动快照或者自定义快照策略吗？

2953

0

0

高性能计算（Alibaba Cloud HPC）可以使用镜像共享、复制等功能吗？

3125

0

0

高性能计算（Alibaba Cloud HPC）GPU物理机配置是什么？

3082

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

相关文章

DP读书：鲲鹏处理器架构与编程（八）3.1鲲鹏处理器片上系统与Taishan处理器内核架构

DP读书：鲲鹏处理器架构与编程（十）鲲鹏软件生态与云服务

DP读书：《openEuler操作系统》（四）鲲鹏处理器

RDMA 协议中的王者：RoCE v2网络，低延迟、高吞吐量！

一种高性能计算和数据中心网络架构：InfiniBand（IB），低延迟、高带宽、可扩展性！

还有其他疑问?