2017年超算大会,最新Top500榜单公布,但这里要说的不是中国的强力表现——虽然还是让我们简单回顾一下,中国上榜的超级计算机系统数量超越了美国(202 vs 143),神威·太湖之光和天河二号第四次蝉联冠亚军——而是英伟达。
最新的Top500超级计算机榜单中,英伟达的DGX SaturnV 系统排名第36。此外,榜单上有34个系统使用了他家的GPU。不仅如此,在全球Top20最高效的超级计算机集群中,有14个使用了英伟达的硬件。如果这还不够,该公司现在宣布,DGX SaturnV集群升级,使用最新的Tesla V100芯片。
单块Tesla V100芯片的规格令人印象深刻:有21亿个晶体管(1455 MHz),5120个流处理器,16 GB的封装HBM2内存,可提供900 GB/s的最大理论带宽。 一个DGX-1节点有8个V100芯片,浮点计算性能高到离谱。
现在,英伟达在DGX SaturnV系统里组装了660个DGX-1节点。660个!如果你把GPU从SaturnV中拿出来一个一个挨着放,差不多能排上一公里。
升级后的系统性能数字也十分可观:5280个Tesla V100 GPU,提供高达660个“AI”(FP16)petaFLOPS,80 petaFLOPS(FP32),以及40 petaFLOPS(FP64)。超大容量的半精度处理,至少部分来自于每个Volta GPU的672个张量处理核。
英伟达表示,计划将SaturnV用于超大规模单一任务关键型问题,同时解决对时间敏感的内部研究挑战。该公司表示,其GeForce产品团队将使用SaturnV来分析客户数据,以提供更优的游戏体验。SaturnV也已经用于英伟达自动驾驶项目,参与模拟了30万英里的驾驶数据。
英伟达还强调新集群的能效。升级后的DGX SaturnV集群,每瓦特功耗提供15 gigaFLOPS(FP64)计算能力。英伟达表示,其在开发系统方面的经验,包括调度和集群管理方面的创新,将为购买新集群的客户带来超值享受。
如果英伟达提供的理论数据能保持住,SaturnV的排名今后可能会比现在的名次(Top500第36名)还要高。完工之后,SaturnV可以轻松进入世界超算前十名,甚至有希望杀入前五。
原文发布时间为:2017-11-16
本文作者:文强
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号