【GPU称霸超算TOP500最新榜单】美国重夺全球超算霸主,总算力56%来自GPU

简介: 在近日举行的ISC会议上,最新Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,中国的神威·太湖之光排名第二。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。但在进入榜单的系统数量方面,中国仍然远超美国。

TOP500是针对全球已知最强大的计算机系统做出排名与详细介绍的项目。此项目始于1993年,今年已经是第25年。TOP500每年公布两次最新的超级计算机排名,一次是在6月份的国际超级计算机大会(ISC),第二次则是在11月份的全球超级计算大会(SC)。

近日举行的ISC会议上,最新一期Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,两个新系统进入前5。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。

3d5311d591c26c8a8258cb84e5e403865f71b91a

Summit超级计算机。来源:橡树岭国家实验室

由IBM总包设计建设,目前在美国能源部(DOE)的橡树岭国家实验室(ORNL)运行的Summit超级计算机,在作为TOP500榜单基准的高性能Linpack(HPL)基准测试中以122.3 petaflops(每秒12.23亿亿次)的性能问鼎榜首。Summit超算有4356个节点,每个节点配备2颗22核的Power9 CPU和6颗NVIDIA Tesla V100 GPU。节点与Mellanox双轨EDR InfiniBand网络连接在一起。

Summit的Linpack测试的理论峰值性能是187.7 petaflops。在Linpack测试中,Summit超算提供122.3 petaflops的性能,计算效率达到65.2% ——这对新机器来说并不差,而且显然会随着时间的推移而改善。

排名第二的是中国的神威·太湖之光,由国家并行计算机工程技术研究中心(NRCPC)开发,安装在国家超级计算无锡中心。该系统在过去两年里一直名列榜首,自2016年6月上线以来,它的HPL成绩一直保持不变,为93 petaflops。神威·太湖之光在Linpack性能测试中的计算效率达到74.2%,达到93 petaflops的性能的功耗为15.37百万瓦(megawatts),而Summit系统达到122.3 petaflops性能的功耗仅8.81百万瓦。

美国能源部劳伦斯利弗莫尔国家实验室的新系统Sierra排名第三,它的HPL性能是71.6 petaflops。同样由IBM打造的Sierra超算的架构与Summit非常相似,有4320个节点,每个节点均由两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU驱动,并使用相同的Mellanox EDR InfiniBand作为系统互连。

天河二号尽管经过了一次重大升级,用定制的Matrix-2000协处理器取代了5年前的Xeon Phi加速器,但它还是下降了两名,由6个月前的第二名变成第四名。天河二号的新硬件将其HPL性能从33.9 petaflops提高到61.4 petaflops,同时将功耗略微提高了约4%。天河二号由中国国防科技大学(NUDT)开发,部署在国家超级计算广州中心。

AI Bridging Cloud Infrastructure (ABCI)是排名第五的系统,由日本富士通公司制造,它的HPL性能达到19.9 petaflops。ABCI由20核的Xeon Gold处理器和NVIDIA Tesla V100 GPU驱动,安装在日本国家先进工业科学技术研究所(AIST)。

瑞士的Piz Daint (19.6 petaflops)、美国的Titan (17.6 petaflops)、美国的Sequoia (17.2 petaflops)、美国的Trinity (14.1 petaflops),和美国的 Cori (14.0 petaflops) 分别排第6位至第10位。

e5f63ecce229a426460ac6bdbfa7ff522a44cb6c

TOP500的前10名

TOP500榜单中国超算数量超过美国

接下来我们看看TOP500的一些关键概况。

e63ecc4fd104a06db253fd7595849c0a280d1ac9

尽管美国在榜单上的排名靠前,但目前美国在榜单上的系统只有124套,创历史新低。就在6个月前,美国在榜单上的系统还有145套。与此同时,中国进入榜单的系统达到206套,占比41%,6个月前是202套。接着是日本,有36套系统,英国22套,德国21套,法国18套。这些数字与上次的榜单基本相同。

94aa1707c81f83614b0dd0538ee2a570890b86cd

国家超算数量年度变化

不过,主要归功于Summit和Sierra,美国在性能方面从中国手中夺回了领先地位。目前,美国的系统占TOP500系统性能总和的38.2%,中国排在第二位,占29.1%。

今年是第一次TOP500榜单的所有500套系统的总性能超过百亿亿次级别(exaflop),确切地说,已经达到1.22 exaflops。这比去年11月时的 845 petaflops 要高。其中,有273套系统的HPL性能超过1 petaflops,而上次的榜单超过只有181套系统性能超过1 petaflops。

CPU架构Intel Xeon占主导地位,56%的计算来自GPU

就处理器架构而言,Intel Xeon在CPU架构方面占据主导地位。

e85d7f43079d80b5f69bf9454929f5640a316c6b

未来几年,IBM和AMD可能会分别凭借Power和Epyc处理器迎来复兴,而Arm服务器芯片也将从中分得一杯羹。但即便如此,Intel Xeon仍将继续在CPU方面占据主导地位。

在加速器方面,TOP500系统中有110个使用加速器,相比2017年11月时的101个加速系统略有增加。TOP500超算的总体性能有一半来自某种形式的加速系统。这些使用加速器的系统中有96个使用NVIDIA GPU,其中前10名就有5个:Summit,Sierra,ABCI,Piz Daint和Titan。此外,使用加速器的系统中有7个配备了Xeon Phi协处理器,而PEZY加速器被用在4个系统中。另外20个系统使用Xeon Phi作为主处理器。

TOP500的几乎所有超级计算机(97.8%)都由拥有8个或更多内核的主处理器驱动,超过一半(53.2%)的主处理器有超过16个内核。

10G或更快的以太网在247个系统中被使用,比6个月前榜单的228个多。此外,139个系统使用InfiniBand,比上次榜单的163个少。有38个系统使用英特尔的Omni-Path技术,上次的榜单是35个。

65f4c091c5be97fb3664df93e1b46b767e29daa7

TOP500榜单中,56%的计算来自GPU。越来越多的厂商开始谈论“人工智能超级计算机”(AI supercomputers),因为可以加速传统HPC工作负载的CPU-GPU混合架构也可以用于机器学习训练。

自1993年以来,TOP500的总性能、排名第一以及排名500的超算性能变化如下图所示:

48f104b42b8c99eb7be618c9d4edc338f7ab058d

另一个变化是,榜单中学术、机密和研究类型的超算有所减少,而用于工业的超算比例增加了:

6141247e5869cb19824c12ae2a8e1d81d543933c

以下是按系统份额的厂商排名,联系有122套系统上榜,占23.8%,其次是HPE,15.8%(79套系统),浪潮,13.6%(68套系统),Cray, 11.2%(56套系统),曙光, 11%(55套系统)。

dddbcd11a06cf488cd56c0c6c441adf0efb36378

尽管IBM拥有前三名超级计算机中的两款:Summit和Sierra,但它在整个榜单中只有19套系统。然而,由于这两台机器,IBM贡献了TOP500总性能的19.9%。接着是Cray,性能份额为16.5%,联想为12.0%,HPE为9.9%。

Green500榜单

最后,我们看一下Green500的榜单。Green500中排名前三的超算都来自日本,它们基于ZettaScaler-2.2架构,使用PEZY-SC2加速器。而前10名中的其他系统都使用NVIDIA GPU。

最高能效的超级计算机仍然日本理研的Shoubu(菖蒲) system B,能效为18.4 gigaflops/watt,在TOP500榜单中排名第362位。

能效排名第二的是位於日本高能加速器研究组织/KEK的Suiren2系统,达到16.8 gigaflops/watt,在TOP500榜单中排名第388位。

Green500的第三名是美国的DGX SaturnV Volta系统,接着是Summit(美国),TSUBAME 3.0(日本),AIST AI Cloud(日本),AI Bridging Cloud Infrastructure(日本),new IBM MareNostrum P9 cluster(西班牙),DOE’s Summit system(美国),以及Wilkes-2(英国)。

作为不依赖任何加速器的最高能效的超级计算机,神威·太湖之光在Green500榜单上排第22位。


原文发布时间为:2018-06-27

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:【GPU称霸超算TOP500最新榜单】美国重夺全球超算霸主,总算力56%来自GPU

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
机器学习/深度学习 人工智能 分布式计算
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
121 0
|
机器学习/深度学习 人工智能 分布式计算
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
149 0
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
|
监控 异构计算
阿里云超算集谛优化GPU异构并行性能:GROMACS
阿里云超算集谛优化GPU异构并行性能:GROMACS
4386 0
|
机器学习/深度学习 人工智能 自动驾驶
刚刚,黄仁勋发布全球最大GPU,超算级逆天算力,仅售39.9万美元
今天在刚刚结束的GTC 2018上,英伟达CEO黄仁勋说两件大事,一是发布了迄今最大的GPU,二是暂定自动驾驶暂停研发。随后英伟达股价下跌3.8%。GPU正在成为一种计算范式,但本质性突破乏善可陈,教主一路回顾过去创下的纪录,而鼎盛之下,衰退的迹象,似乎已经潜藏。
2245 0
|
2天前
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
|
3月前
|
机器学习/深度学习 编解码 人工智能
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析
随着人工智能、大数据和深度学习等领域的快速发展,GPU服务器的需求日益增长。阿里云的GPU服务器凭借强大的计算能力和灵活的资源配置,成为众多用户的首选。很多用户比较关心gpu云服务器的收费标准与活动价格情况,目前计算型gn6v实例云服务器一周价格为2138.27元/1周起,月付价格为3830.00元/1个月起;计算型gn7i实例云服务器一周价格为1793.30元/1周起,月付价格为3213.99元/1个月起;计算型 gn6i实例云服务器一周价格为942.11元/1周起,月付价格为1694.00元/1个月起。本文为大家整理汇总了gpu云服务器的最新收费标准与活动价格情况,以供参考。
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析
|
1天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
2月前
|
机器学习/深度学习 存储 人工智能
阿里云GPU云服务器实例规格gn6v、gn7i、gn6i实例性能及区别和选择参考
阿里云的GPU云服务器产品线在深度学习、科学计算、图形渲染等多个领域展现出强大的计算能力和广泛的应用价值。本文将详细介绍阿里云GPU云服务器中的gn6v、gn7i、gn6i三个实例规格族的性能特点、区别及选择参考,帮助用户根据自身需求选择合适的GPU云服务器实例。
阿里云GPU云服务器实例规格gn6v、gn7i、gn6i实例性能及区别和选择参考