阿里云研发工程师:HPC优化实例动手实验讲解

本文涉及的产品
云服务器 ECS,u1 4核16GB 1个月
云服务器 ECS,u1 2核4GB 3个月
云服务器 ECS,u1 4核8GB 1个月
简介: 近日,全球领先的云计算厂商阿里云宣布最新HPC优化实例hpc8ae的正式商业化,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE场景下的性价比最少提升50%。


 

引言:近日,全球领先的云计算厂商阿里云宣布最新HPC优化实例hpc8ae的正式商业化,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE场景下的性价比最少提升50%。


本文整理自阿里云高性能计算研发工程师曹杭在【HPC优化实例商业化发布会】中的动手实验分享,集中讲解HPC优化实例动手实验Demo细节。


【 单节点的摩托车外流场仿真实验 & 多节点大规模并行的6000万网格风电场模拟实验 demo讲解 】

 

HPC8ae实例性能解读


Hpc8ae优化实例有以下几个特点。


首先它是基于AMD一站式的Zen4 Genoa处理器,基频是3.4GHZ,BOOST3.75GHZ,其次比较重要的是其有内存带宽的增强,适用于仿真HPC应用,比如气候气象、CFD的Fluent等等工业仿真应用。



第三点是其支持云上的eRDMA,支持大规模的并行运行应用的通信需求。最后一点是,这是首次AMD实例支持向量指令集AVX512。上图右侧给出一些细节参数,包括eRDMA 8us时延,实测了浮点峰值3.63GFlops,实测内存带宽,stream带宽603GB/S。


【 HPC应用性能提升表现 】


基于E-HPC的单节点摩托车外流场仿真实验



上述实验我们依然是基于ehpc来做,包括以下几个步骤:


1、使用EHPC集群创建HPC集群;

2、部署OpenFoam环境,使用开源的CFD仿真软件,用其做实验;

3、EHPC-Portal算例前处理演示;

4、提交“作业”进行计算运行;

5、可视化结果。



上图右侧是ehpc界面展示。


以下为【单节点的摩托车外流场仿真实验】详细操作分解:


1首先创建一个集群。大部分选项可以选默认,之后选关键节点,选择从c8ae小规格实例作为管理节点,保存配置。配置计算队列,选高带宽低时延eRDMA网络。可用区切换到M区,实例规格选择HPC8ae优化实例;


2、选择存储。如果有创建可以直接默认,软件部分会有OPEN Foam,后续会添加OPEN Foam环境;登录节点修改成c8ae实例;保存配置,确认配置没有问题后,可以直接设立密码和创建集群。(由于时间关系,我们直接关注已经创建出来的现成集群),扩容时选择HPC8ae实例扩容,此处已经扩容出实例,有6个节点;


3、直接登录上集群。OPEN Foam环境已经部署好;回到控制台,从portal进入,重新登录,进入到submit,提交OPEN Foam作业,已经编排好的摩托车的仿真实验的作业模板;


4、选择作业队列。下面是计算节点和任务数,直接点击提交作业;作业正在RUNNING,也可以从portal进入看到步骤;通过会话管理进到VNC,新建一个会话localhost提交作业;窗口打开了VNC的terminal,因为作业还在运行,先看前处理部分,这是仿生的摩托车模型;


5、等作业运行32个进程。VNC通过调度器命令可以直接看作业运行状态,作业已经结束了,状态可以看到是一个compute状态;回到VNC,再看一下后处理流程。这里用parafoam看一下结果文件;来到paraview界面,查看速度场的变量情况;点击wireframe可以看到仿真速度场结果,这是后处理速度场部分。


到这里,第一个实验,单节点的摩托车外流场仿真实验已经结束,大家可以参照上面的步骤及视频来动手操作。



多节点大规模并行的6000万网格风电场模拟实验


第二个实验,多节点大规模并行的6000万网格风电场模拟实验。和第一个实验操作流程类似,这个模型更大,六千万网格的风电场模拟实验,这一部分主要区别是性能表现。



Demo实验亮点的总结


第一点,单节点性能的大幅领先;第二点,大规模并行HPC集群一键部署与仿真的作业管理支持;第三点,HPC实例+eRDMA,通信低时延高带宽并行效率有明显保证。第四点,E-HPC PORTAL对HPC业务的一站式前后处理支持。


后续OpenFOAm在E-HPC优化实践的实验,HPC的优化实践的实验也会上架到EHPC控制台。后续会直接给出一个集群模板,一键部署OpenFOAm集群例如气候、气象、集群等。

相关文章
|
6天前
|
运维 自然语言处理 弹性计算
阿里云操作系统智能助手OS Copilot实验测评报告
摘要: 体验阿里云OS Copilot活动,用户发现教程中存在步骤缺失和不明确之处,如服务器地区未明确、安全组配置细节不全、AccessKey创建过程复杂、代码示例需改进等。用户建议提供详细步骤,尤其是对于新手,以提高易用性。OS Copilot作为智能助手,其问答和编程辅助功能受到好评,但实验应展示更多连续交互能力。用户总体满意产品,期待更完善的引导。
192 8
阿里云操作系统智能助手OS Copilot实验测评报告
|
4天前
|
弹性计算 运维 自然语言处理
阿里云操作系统智能助手OS Copilot实验测评报告
OS Copilot是阿里云Linux的智能助手,助于提升运维效率,通过学习用户习惯提供智能建议。开发者反馈其在DevOps场景中非常有用,给予10分帮助度评价。用户赞赏其命令执行功能,希望能扩展多命令执行和错误自动修正。与ACK、ECS等集成,可自动化部署和CI/CD流程。文档清晰,适合新手,用户愿意推荐并参与开源开发。
67 3
阿里云操作系统智能助手OS Copilot实验测评报告
|
6天前
|
存储 编解码 网络协议
阿里云服务器计算型和通用型四代云服务器实例区别及选择参考
目前阿里云在售的云服务器中,计算型和通用型实例规格都包含了第5代、第6代、第7代和最新第八代倚天云服务器产品,例如计算型实例中有c5、c6、c7、c8y实例,而通用型实例有g5、g6、g7、g8y等实例,有的新手用户并不清楚这四代产品之间的差别,本文为大家展示这四代云服务器实例在规格、CPU(核)、内存(G)、计算、存储、内存以及不同配置的指标数据等方面为大家做个对比,让大家了解一下他们之间的不同,以供参考和选择。
阿里云服务器计算型和通用型四代云服务器实例区别及选择参考
|
5天前
|
弹性计算 运维 自然语言处理
阿里云操作系统智能助手OS Copilot实验测评报告
阿里云OS Copilot是一款专为Linux设计的智能运维助手,利用大语言模型提供自然语言问答、命令执行辅助和系统调优功能。软件维护工程师反馈,OS Copilot易于上手,文档清晰,对提升运维效率有显著帮助,评分10/10。其轻量级设计、准确的回答是主要优点,但可能在复杂场景下表现不足。用户期望扩展到更多Linux发行版,增加系统优化建议、代码优化和日志分析功能,并能与其他产品如ACK、ECS联动。希望能有异常处理提示和日志输出以增强问题定位。
74 14
|
5天前
|
弹性计算 人工智能 运维
阿里云操作系统智能助手OS Copilot实验测评报告
**摘要:** 在阿里云与CSDN联合的OS Copilot测试中,一名学生体验者发现该智能助手是强大的编程学习工具,给予10分的帮助评价。尽管有新手上手难度和兼容性问题,他仍强烈推荐并有意参与开源开发。OS Copilot的亮点包括直接的交互式知识问答、编程辅助及命令执行。相比其他产品,其优点是简洁和准确性,但需改进新手教程。用户期待更多功能,如系统优化建议,扩大操作系统支持,并建议与阿里云产品如ACK、ECS集成,以提升运维效率。
87 12
|
4天前
|
弹性计算 运维 自然语言处理
阿里云操作系统智能助手OS Copilot实验测评报告
OS Copilot是Alibaba Cloud Linux基于大模型构建的操作系统智能助手,其旨在通过自然语言问答、辅助命令执行及系统运维调优等功能,提升用户对Alibaba Cloud Linux的使用效率。
|
4天前
|
弹性计算 运维
阿里云操作系统智能助手OS Copilot实验测评报告
简介:体验OS Copilot对于新人使用是友好的,教程给出的比较全面,还支持语言问答,命令执行等优点,还允许用户直接在操作系统内部使用阿里云,完成ECS的实例查询等操作。但是在系统兼容上表现出不足,对于服务器地区不明确。但总体来说测评者对OS Copilot其智能化、高效化、专业化评价是高的。
18 4
|
4天前
|
弹性计算 人工智能 运维
阿里云操作系统智能助手OS Copilot实验测评报告
阿里云操作系统智能助手OS Copilot实验测评报告
61 2
|
4天前
|
弹性计算 运维 监控
阿里云操作系统智能助手OS Copilot实验测评报告
阿里云OS Copilot助力学生提升学习效率,简化Linux操作。作为学生,体验者发现它在代码理解和诊断上极具价值,给予新手友好体验,但存在命令执行限制和错误处理问题。评分10/10,愿推荐并参与未来开发。功能上,知识问答、辅助编程和命令执行深受喜爱。对比其他产品,OS Copilot简洁集成,但需改善多命令支持和错误分析。期望支持更多操作系统及与ACK等工具联动,增强系统管理和故障排查。
30 1
|
4天前
|
弹性计算 运维 Linux
阿里云操作系统智能助手OS Copilot实验测评报告
体验OS Copilot对于新人使用是友好的,教程给出的比较全面,还支持语言问答,命令执行等优点,还允许用户直接在操作系统内部使用阿里云,完成ECS的实例查询等操作。但是在系统兼容上表现出不足,对于服务器地区不明确。但总体来说测评者对OS Copilot其智能化、高效化、专业化评价是高的。
33 1