当“冰雨”拍向服务器+体验莱布尼茨水冷超算

简介:

高性能计算(High performance computing,也就是我们常说的HPC) 指的是使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境。有许多类型的HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。

其实高性能计算机乃至整个计算机,都是因军事应用而诞生,最早可以追溯到图灵、冯·诺依曼时代。如今的高性能计算机已经全面应用到各个领域,包括天气预报、飞机汽车制造、生物医疗以及动画影视制作等等。而超算的发展方向也从原来的大规模、高功耗向节能环保迈进。近日笔者在德国莱布尼茨超算中心了解到的这套系统就是基于节能而开发,通过水冷系统充分诠释了科技的进步。

在谈水冷之前先插播一个小花絮,此次德国高性能计算之旅途中,我们在德国象征新天鹅城堡遭遇一场大暴雨,把所有人淋了个落汤鸡。暴雨夹杂着暴风给在场所有人冻得嘴唇发紫,脑袋中似乎不停的播放着“冷冷的冰雨在脸上胡乱的拍”....

新天鹅堡给我们留下了“深刻”的印象

众人湿身在狂风瑟瑟发抖,我跟大家说“看来这风冷还是挺猛的...”周志强老师(联想集团中国区商用事业部终端计算总监、企业架构师)在旁边手指着自己湿漉漉的衣服道“这哪是风冷?分明是水冷嘛!”水冷的“散热”效果确实领略到了,只不过所有人都狼狈不堪。参观水冷就先亲身体验了一把,果然不虚此行。

莱布尼茨超算中心通过水冷降低1000万欧元电费成本

LRZ高性能计算中心

言归正传,我们继续看超算。最近大热的联想首创的45℃温水水冷技术,相信大家都不会陌生,它凭借更高的性能、更低的能耗、更少的占地空间和更低的噪音,在全球范围内获得了越来越多用户的青睐。用莱布尼茨超算中心工作人员的话说:“这里静的可以开音乐会”。

德国巴伐利亚科学院莱布尼茨超级计算中心(LRZ)运营的SuperMUC,是一款采用了革新性温水冷却技术的超级计算机。

水冷服务器系统

据了解,LRZ全部采用了联想NeXtScale System系统,在该实验室实现了1.1的PUE值,拥有9216节点,峰值运算速度2897000万亿次(Gflops),整机效能高达90.95%,5年来整体电费下降37%:从2760万欧元降至1740万欧元,节省超过1000万欧元。

水冷系统降低能耗40%

与传统风冷系统相比,LRZ水冷系统省掉的风扇节省了10%的能耗,此外冷却系统减少20%能耗,6%能耗节省来自软件管理。因此实现了节省40%总能耗的设计思路。

据工作人员介绍,LRZ超算部分功耗为2兆瓦,冷却本身不消耗电力,采用自然冷却方式,可以称之为“免费冷却”。其他主要是水泵循环等消耗的电力,占得非常少。超算中心冷却水温度一般在45度左右,自然冷却可以降到38度,有一定的温差,因此可以满足服务器冷却需求。此外,LRZ还利用系统散热后的余热对建筑物进行供暖,将欧洲人的环保理念发挥得淋漓尽致。

思考:水冷散热方式在我国推广的并不好,绝大多数数据中心、高性能计算中心都采用传统风冷散热。新技术方面国外用户尝试的比较多,还有利用高纬度地区冬天寒冷的空气进行散热、利用山洞、海水冷却等等,但在国内的推广却是凤毛麟角。之前笔者曾经采访过一家数据中心企业,很多年前他们在天津尝试过新风(自然风)冷却系统,但北方城市空气污染和腐蚀现象比较严重,最终只能继续改回传统空调风冷。不过随着技术的不断发展,现在也出现了更符合“国情”的空气过滤系统。

相比之下水冷更容易被国内用户接受,据了解,此次TOP500的冠军神威太湖之光就采用了水冷散热。而国内也有企业在内蒙、东北等高纬度地区建设自然风冷却数据中心,在除夏季之外的其他三个季节均可用新风冷却,极大降低冷却成本,加入空气过滤系统也可以减少空气腐蚀现象。新技术正在逐步被中国市场所接受。


本文作者:云中子

来源:51CTO

相关文章
|
存储 机器学习/深度学习 人工智能
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
在刚刚正式开幕的国际超级计算机大会(SC2019)上,英伟达 CEO 黄仁勋宣布了三项重大的产品信息:基于 GPU 加速器的 Arm 服务器、可在微软 Azure 云服务上使用的 GPU 加速型超级计算机 NDv2 以及几分钟即可实现数据移动的 Magnum IO 软件套件。
145 0
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
|
存储 机器学习/深度学习 人工智能
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
在刚刚正式开幕的国际超级计算机大会(SC2019)上,英伟达 CEO 黄仁勋宣布了三项重大的产品信息:基于 GPU 加速器的 Arm 服务器、可在微软 Azure 云服务上使用的 GPU 加速型超级计算机 NDv2 以及几分钟即可实现数据移动的 Magnum IO 软件套件。
112 0
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
|
3天前
|
弹性计算 运维 安全
阿里云ecs使用体验
整了台服务器部署项目上线
|
4天前
|
存储 弹性计算 监控
【阿里云弹性计算】阿里云 ECS 性能优化秘籍:提升应用响应速度与资源利用率
【5月更文挑战第22天】阿里云ECS优化涉及实例规格选择、OS与应用配置、网络配置、存储优化及数据库连接池管理。合理挑选CPU和内存,关闭无关服务,利用EIP和负载均衡优化网络,选择合适存储类型,并通过监控工具进行性能分析和压力测试,以提升响应速度,优化资源利用率,降低成本,增强企业竞争力。示例展示了Java数据库连接池配置优化。通过持续探索和实践,可最大化发挥ECS潜力。
67 7
|
1天前
|
弹性计算 监控 数据库
【阿里云弹性计算】企业级应用上云实战:基于阿里云 ECS 的 ERP 系统迁移案例
【5月更文挑战第25天】制造企业将面临资源不足、维护成本高和数据安全问题的ERP系统迁移到阿里云ECS,实现业务上云。通过数据迁移、应用部署、网络配置和性能优化等步骤,企业享受到弹性计算资源、高可靠性和数据安全优势,降低维护成本。阿里云提供24小时支持,助力企业数字化转型。此案例展示企业级应用上云的可行性,鼓励更多企业借助云计算实现创新发展。
5 0
|
1天前
|
存储 弹性计算 人工智能
【阿里云弹性计算】AI 训练与推理在阿里云 ECS 上的高效部署与优化
【5月更文挑战第25天】阿里云ECS为AI训练和推理提供弹性、可扩展的计算资源,确保高性能和稳定性。通过灵活配置实例类型、利用存储服务管理数据,以及优化模型和代码,用户能实现高效部署和优化。自动伸缩、任务调度和成本控制等策略进一步提升效率。随着AI技术发展,阿里云ECS将持续助力科研和企业创新,驱动人工智能新时代。
6 0
|
1天前
|
弹性计算 监控 容灾
【阿里云弹性计算】云上灾备解决方案:基于阿里云 ECS 的业务连续性策略
【5月更文挑战第25天】阿里云ECS提供强大的云上灾备解决方案,保障企业业务连续性。通过高可用基础设施、数据备份和异地容灾服务,应对自然灾害、硬件故障等突发事件。示例代码展示如何配置数据备份。企业应合理规划资源,定期演练,监控优化灾备系统。阿里云将持续创新,为企业提供更优质的灾备解决方案,支持各类型企业在数字化时代稳定运行,实现业务连续性。
5 0
|
2天前
|
存储 机器学习/深度学习 弹性计算
【阿里云弹性计算】阿里云ECS实例选择指南:理解不同实例系列的适用场景
【5月更文挑战第24天】阿里云ECS实例系列包括计算优化型、内存优化型、存储优化型、GPU加速型和通用型,适用于不同场景。计算优化型适合计算密集型任务,内存优化型适用于内存数据库,存储优化型针对高I/O需求,GPU加速型用于图形处理和深度学习,通用型则平衡各类需求。选择时需考虑应用类型、性能需求、成本效益和可扩展性。提供的示例代码展示了如何使用阿里云CLI创建通用型实例。本文旨在帮助用户根据业务需求选择最适合的ECS实例。
9 1
|
2天前
|
弹性计算 缓存 负载均衡
【阿里云弹性计算】游戏服务器部署实战:利用阿里云ECS打造低延迟游戏环境
【5月更文挑战第24天】使用阿里云ECS打造低延迟游戏环境的实战指南,包括选择高性能处理器和SSD存储的实例,规划架构,选择近玩家的地域和可用区,部署软件,优化性能及监控。通过负载均衡、自动扩展和数据缓存提升体验,同时关注数据安全与网络安全。
11 4

热门文章

最新文章