阿里云弹性高性能计算E-HPC强势来袭,全新打造一站式云超算

简介: 如今,高性能计算已在不知不觉中渗透到人类生活的方方面面。从材料科学到石油勘探、金融市场、应急管理、医学和互联网等领域,高性能计算无一不大显身手,帮助快速攻克各种疑难问题。

HPCHigh Performance Computing,高性能计算)通常指将计算能力积聚,用并行计算方式解决更大规模的科学、工程和商业问题。如今,高性能计算已在不知不觉中渗透到人类生活的方方面面。从材料科学到石油勘探、金融市场、应急管理、医学和互联网等领域,高性能计算无一不大显身手,帮助快速攻克各种疑难问题。

5f3404004108ed8128a0634ad70e619a1c030bbe 

针对日益增长的 HPC 计算能力需求,阿里云在现有基础设施之上推出了弹性高性能计算E-HPC产品,为用户提供一站式的高性能计算服务的云平台,即HPCaaS公有云服务。20171012日,产品正式发布公测上线,截止到目前,已有三百多家来自国内外的高性能计算用户在使用E-HPC公测资源,测试的应用主要集中在科学计算,AI/机器学习,设计/仿真/渲染等领域。

项目背景

由于高性能计算集群昂贵,缓慢的初期建设投资,包括集群的维护、升级,管理和一次性购买昂贵的软件许可证的困难,如何“不用排队,申请任意规模,有丰富可共享的计算软件环境”成为高性能用户普遍的诉求。另一方面,高性能计算用户对计算性能,扩展性和并行效率的追求,使得他们无法快速拥抱云计算虚拟化的计算资源。

随着云计算技术的逐渐成熟,高性能计算用户对HPCaaS的需求变得越来越实际和迫切,HPCaaS包括使用集群服务器和存储作为资源池的功能,用户提交其作业请求的Web界面,以及可以在给定集群上并行调度大规模并行应用的能力,调度多个不同并行应用程序的智能调度机制,同时考虑到不同的应用程序性能特征以达到最大总体生产力。

为此,阿里云开发了自身IaaS云产品之上的高性能计算PaaS平台,基于阿里云弹性计算ECS实例、异构计算EGS实例、超级计算集群SCC虚拟专用网VPC、高可靠高可用的NAS存储等组件,构建了一整套HPC用户熟悉的并行计算软件环境,用户在阿里云公共云上申请集群资源,快速构建和安装部署HPC需要的并行调度管理软件、通讯库、性能库和一系列常用高性能计算应用,用户通过熟悉的阿里云服务界面,不但得到了一个“独享式”的云端超算中心资源,还同时继承了阿里云产品的稳定,安全的品质和与其它阿里云产品打通的能力——这意味着用户可以将HPC和阿里云大数据分析、数据可视化和AI产品结合使用,激发出更多的创新。

技术解析

阿里云弹性高性能计算E-HPC与传统超算中心以及自建集群相比,提供了一种快捷、弹性、安全以及互通的公共云高性能计算服务。

  • 快捷:快速创建基于阿里云ECS/EGS/SCC/VPC/NAS等资源的计算集群,根据用户选择快速构建运行时环境和丰富的支撑软件栈;
  • 弹性:根据计算负荷,时间和性能要求增减和释放计算节点,存储等资源,节约大量的CAPEX费用,包括但不限于硬件系统费用,永久软件许可证费用,机房维护费用,运维人工费用等。由于使用的是阿里云弹性计算资源,可以是实现即买即用的任意规模组合和节点自动缩容扩容的功能;
  • 安全:E-HPC是构建在阿里云IaaS产品之上的PaaS平台,所以集成了阿里云产品的组合安全性,如VPC保证的网络安全,ECS保证的计算安全和NAS保证的高可用高可靠存储等;
  • 互通:由于构建在阿里云IaaS资源之上,E-HPC和其它云产品可全面打通,例如通过云盘,共享存储和VPC网络安全交换数据,并可以和其它数据分析,可视化产品互通完成复杂的数值仿真和数据分析闭环。

e8aeece75d6b08a52917769580efc4e1532419a6

此外在技术层面,阿里云弹性高性能计算E-HPC与传统超算中心、自建物理 HPC集群、自建云服务器集群等相比较,可以分析得出其具有独特的竞争优势。

  • E-HPC相比传统超算中心:E-HPC按需要使用的规模购买,无需排期,即买即用;E-HPC机型种类多,可根据应用需求购置最适合的计算资源配比(如EGS实例);E-HPC充分复用阿里云产品,大大提高了数据安全性和高可用性。
  • E-HPC相比自建物理HPC集群:E-HPC可节约巨量CAPEX投入,包括但不限于硬件系统费用/软件许可证费用(多核,多节点)、服务器机房建设/电力和制冷费用、平日运作的维护支持费用;使用E-HPC无需顾虑硬件升级换代;E-HPC打通阿里云全系列产品,可扩展性极强。
  • E-HPC相比自建云服务器集群:E-HPC提供方便的软件管理服务,覆盖HPC应用全部支撑软件栈功能,并随HPC共同体(OEM/OSV/ISV/用户/开发者/开源社区)版本升级;E-HPC提供云端Elastic License的按需付费的软件许可证调度机制,为用户节约一次性购买成本,同时为ISV软件厂商和个人软件开发者提供了阿里云市场的新途径,E-HPC还能够提供集群节点根据负荷变化的自动伸缩服务。

c34ea48b2113eddea33f27fc6890065e21a57e26

阿里云弹性高性能计算E-HPC架构图

场景应用

E-HPC是一个组合型产品,其计算节点有普通ECS实例、GPU加速EGS实例、超级计算集群SCC实例可供选择。ECS实例地域覆盖面广,适合在全球各地域部署;EGS实例适合深度学习等支持并行加速应用的客户使用;SCC实例提供RDMA网络互联,适合大规模集群,提高加速比。时下,有越来越多的中小企业和大企业需要普惠高性能计算来提供HPCaaS服务:

  • 在季节性工作负载或对额外资源的弹性需求时;
  • 在将IT业务云化,无需投资额外的基础架构或增加等待工作队列的时间时;
  • 在希望通过统一平台获取行业应用软件许可证资源时;
  • 在需要支持多用户隔离运行多个应用程序且快速获得资源时。

阿里云的弹性高性能计算产品E-HPC构筑了HPCaaS的青藏高原。

市场解读

阿里云E-HPC是建构于飞天系统上的原生云超级计算平台,对底层计算,网络和存储的调用完全基于阿里云的飞天系统,采用OpenAPI接口,随其它云产品功能和性能一起升级进化。

更为突出的是,E-HPC系统可以和阿里云神龙云服务器/SCC产品无缝对接,基于自研硬件的虚拟化2.0技术,同时具备物理机的性能和稳定性,并提供和ECSEGS虚拟化异构资源的灵活对接,具备完全云特性,这一点是目前国内外云厂商都没有的优势,是真正的“云超算”。。

产品正在集成基于阿里云存储的Lustre高性能并行文件系统, 接入更多主流高性能计算商业软件弹性许可证管理,增强PaaS的云监控,性能优化和丰富的计费体系,正在对接各个细分领域的SaaS合作伙伴,真正打造普惠和专业的云上超算平台。

弹性高性能计算E-HPC基于多年积累的阿里云飞天系统,其功能,性能和体感将随各飞天产品的升级而普惠超算用户,基于阿里云飞天架构开发的HPC软件栈具有和云组间紧耦合,针对云平台优化的特性,和在物理超算平台上增加“云体验”的所谓“超算云”相比,真正释放了云计算的威力,可以说是毫无疑问地国内第一“云超算”产品。

点击此处查看产品使用手册。更多产品详情,敬请关注:https://www.aliyun.com/product/ehpchttps://www.alibabacloud.com/product/ehpc

相关文章
|
1月前
|
存储 人工智能 弹性计算
产品技术能力飞跃,阿里云E-HPC荣获“CCF 产品创新奖”!
9月24日,在中国计算机学会举办的“2024 CCF 全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「 CCF HPC China 2024 产品创新奖」。这也是继 2022 年之后,阿里云E-HPC 再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。
101041 61
|
14天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
9天前
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
16天前
|
存储 人工智能 弹性计算
对话阿里云吴结生:AI时代,云上高性能计算的创新发展
在阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生看来,如今已经有很多行业应用了高性能计算,且高性能计算的负载正呈现出多样化发展的趋势,“当下,很多基础模型的预训练、自动驾驶、生命科学,以及工业制造、半导体芯片等行业和领域都应用了高性能计算。”吴结生指出。
|
14天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
1月前
|
存储 人工智能 弹性计算
产品技术能力飞跃,阿里云E-HPC荣获“CCF 产品创新奖”!
9月24日,在中国计算机学会举办的“2024 CCF全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「CCF HPC China 2024产品创新奖」。这也是继2022年之后,阿里云E-HPC再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。
|
3月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多样化的选择,包括CPU+GPU、CPU+FPGA等多种配置,适用于人工智能、机器学习和深度学习等计算密集型任务。其中,GPU服务器整合高性能CPU平台,单实例可实现最高5PFLOPS的混合精度计算能力。根据不同GPU类型(如NVIDIA A10、V100、T4等)和应用场景(如AI训练、推理、科学计算等),价格从数百到数千元不等。详情及更多实例规格可见阿里云官方页面。
241 1
|
5月前
|
存储 弹性计算 网络协议
阿里云hpc8ae服务器ECS高性能计算优化型实例性能详解
阿里云ECS的HPC优化型hpc8ae实例搭载3.75 GHz AMD第四代EPYC处理器,配备64 Gbps eRDMA网络,专为工业仿真、EDA、地质勘探等HPC工作负载设计。实例提供1:4的CPU内存配比,支持ESSD存储和IPv4/IPv6,操作系统限于特定版本的CentOS和Alibaba Cloud Linux。ecs.hpc8ae.32xlarge实例拥有64核和256 GiB内存,网络带宽和eRDMA带宽均为64 Gbit/s。适用于CFD、FEA、气象预报等场景。
|
5月前
|
存储 弹性计算 网络协议
阿里云高性能计算HPC优化实例商业化发布详解
基于云的高性能计算(Cloud HPC),与传统HPC相比更加灵活、高效。
|
6月前
|
存储 机器学习/深度学习 网络协议
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍
阿里云高性能计算是的阿里云服务器ECS的架构之一,高性能计算实例规格族主要应用于各种需要超高性能、网络和存储能力的应用场景,例如人工智能、机器学习、科学计算、地质勘探、气象预报等场景。高性能计算实例规格族有高性能计算优化型实例规格族hpc8ae、高性能计算优化型实例规格族hpc7ip、计算型超级计算集群实例规格族sccc7等。下面是阿里云高性能计算实例规格族特点、适用场景介绍。
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍

热门文章

最新文章