NASA宣布,有史以来最强大的超级计算机Aitken已经正式投入使用!
不过,这次这个超算Aitken,其实不是新造的,而是对老系统的一次升级。 此次NASA对Aitken进行了性能升级,新增了四个包含 512 个 Rome 节点的新 HPE Apollo 系统机架,使 Aitken 的节点总数达到 3200 个,核心数量达到308224 个。 这一相当大的改进,让扩展后的Aitken性能提高了16%,自去年以来一共提升了 49%。
「实力派」Aitken
Aitken始建于2019年,由HPE负责建造,NASA的科学家们使用Aitken来模拟宇宙飞船的进入、下降和着陆过程。 这台超算是NASA的Artemis计划的一部分,该计划的目标是,2024年将宇航员送入月球的南极地区。 说到命名这件事,Aitken是以美国天文学家Robert Grant Aitken的名字命名的,最初设置1150个节点,46080个核心,221 TB的内存,PUE为1.03,以理论性能为3.69千万亿次浮点运算,通过大量模拟,实现准确而安全的登月计划。 Aitken基于HPE SGI 8600系统,这是一个端到端的、专门建造的HPC平台,包括最佳能源效率的特殊液冷能力。 Aitken位于NASA Ames的新模块化超级计算设施中,这个设施基于与HPE联合开发的MDC(Modular Data Center)方法,显著减少了电力和水资源的使用。 此前,这台超算一直是数百名与NASA有关的科学家和工程师的关键资源,为该机构的太空探索、地球科学和天体物理学方面的研究项目提供重要的算力支持。 此前,Aitken在去年6月的超算Top500榜单中排名第 72 位,今年上升至第 58 位。
「模块化」升级,经济又实用
由于任务需要,NASA要的不是单体的、独立的大型超算系统,比如最近刚刚登顶Top500榜单的「E级」超算Frontier,而是采取了类似于最近欧洲超算设计(如LUMI)的「模块化」方式。 此外,这种额外增加计算节点、增设新机架的升级方式,可以确保在预算中有效控制成本,延长系统的运行寿命。 实际上,NASA这种升级方式早就不是首次使用了,在Aitken之前,NASA的头牌超算是Pleiades。自2008年首次运行以来,一直在使用这种「模块化」升级。 2008年,当「Pleiades」首次投入使用时,它是世界第三强大的超级计算机,今年6月的Top 500排名仍然位居前100。 目前,「Pleiades」仍在运行,并将在NASA Ames与更年轻,更快的「搭档」并肩前行! 这次升级可以更好地发挥30.8万个 AMD Zen 2「Rome」核心的威力,这些核心分布在512个计算节点上。据悉,该超算系统的最初设计 「仅有」46080个英特尔Cascade Lake核心,也是由HPE提供的。 此次升级后,Aitken共包含12个HPE Apollo 9000机架,提供2048个AMD EPYC 7742 Rome节点,每个节点有128个内核,以及4个HPE E-Cell,提供1152个英特尔 Cascade Lake 节点,每个节点有40个内核。 新增加的设备将系统的理论峰值性能推高到每秒13.12PetaFlops,总内存达到1.27PB。 此次Aitken的系统升级,保留了未来的可扩展性,这也是模块化升级的另一个优势:可以灵活地建造新的模块,快速增加算力,满足不断变化的优先事项,应对新任务带来的新挑战。
参考资料:
https://www.hpcwire.com/off-the-wire/aitken-becomes-nasas-most-powerful-supercomputer/
https://www.tomshardware.com/news/nasa-hacks-its-supercomputing-way-through-intel-amd-parts