2023年云栖大会,阿里云弹性计算面向工业仿真、生命科学和芯片设计等行业,阿里云发布了HPC优化实例系列新品,包括内存带宽优化实例hpc8ae、数据和内存优化实例hpc7ip和计算优化实例hpc8y,全面采用物理核,与通用计算实例相比性能提升40%。
阿里云已经有非常多样化、最新的实例选择,为什么我们还要再发布 HPC 实例呢?
因为我们都知道 HPC 应用通常具有计算密集、网络密集、内存密集的特点,目前计算类实例是为互联网 web 应用等通用场景设计的,各项性能比较均衡,缺少针对性优化,也没有节点之间的高速互联。而线下带有 IB 网络的HPC的物理器成本很高,也不具备弹性按需扩展的能力。HPC实例就是为云上 HPC 应用专门设计优化的。
我们采用阿里云最新的CIPU 架构,通过专用的神龙 MoC 来提供虚拟化,性能相比物理服务器,基本 0 损耗。并且我们遵从传统 HPC 的用户习惯,直接提供性能稳定可靠、调度优化的物理核,也帮助用户控制软件 license 费用。
CIPU 提供的免费的 eRDMA 网络,100G 的带宽,低至 8us 的时延,满足 HPC 中紧耦合的、MPI 类并行计算任务的联网需求。eRDMA 兼容传统的 IB verbs 语义,用户应用完全无需改造。
在此基础上,我们还针对工业制造、生命科学和 EDA 应用不同的需求,针对性的优化,最大限度提高应用的性能表现,并且优化成千上百机器规模下运行的成本。
工业仿真场景下的最佳选择:内存带宽优化实例hpc8ae
工业仿真场景下,流体力学计算(CFD),有限元分析(FEA)等应用都需要更高的主频、更高的内存带宽。我们推出新的 hpc8ae 实例,采用第四代 AMD 的 Genoa 处理器,最高 3.75Ghz 主频,提供 500GB/s 的内存带宽,可以大大提升包括 STAR-CCM+、ANSYS Fluent DYNA 在内应用 40%以上的性能。并且 eRDMA 在用户业务 E2E 的测试中,8 节点的并行效率也能完全满足应用的要求。
生命科学场景下的最佳选择:计算和网络优化实例hpc8y
生命科学场景下,我们推出的 hpc8y 实例使用阿里云自研的 ARM 架构的倚天芯片以及 eRDMA 网络。倚天芯片是天然的物理多核设计,最高可有 128 个物理核,并且针对基因测序、分子动力学模拟等软件提供包括数学库、指令集在内的编译优化错误,在 VASP 上,因为倚天自研的优势,与 x86 服务器相比,我们可以提高 90%的性价比,是非常好的降本增效的选择。
EDA场景下的最佳选择:数据和内存优化实例hpc7ip
在半导体设计 EDA 场景下,我们推出的 hpc7ip 实例具有 2T 的傲腾 AEP 内存。与 DDR 内存相比,既能满足 EDA 应用的性能要求,又能大幅降低成本,很好的满足 EDA 后端仿真中众多内存受限应用的需求。与同样是 2T 内存的 re6 实例相比,hpc7ip 性价比提升 50%以上。
目前,阿里云弹性高性能计算平台已助力众多企业企业缩短研发周期,加快业务创新。其中,助力上汽乘用车新车研发每年节省9000万,为广州智药的新药研发效率提升2.4倍,为Arm中国一周内交付7万+弹性资源。