借助数据中心模拟看得更清楚

简介:

本文作者Dave King是Future Facilities公司的产品经理。

据说,计算流体动力学(CFD,Computational Fluid Dynamics)提供了关于数据中心气流的历史视图信息,但到了报告生成时,这些视图信息可能已经过时了。这种将CFD视图作为过去的快照的方法错失了技术(预测的)的真正力量;而这一糟糕的思维方式,似乎在行业内还颇有市场。我曾经与数据中心操作运营人员们在各种不同的会议上进行过无数次的沟通交流,而这些数据中心操作运营人员一直在抱怨说,“为什么我需要有人来进行CFD研究,然后告诉我数据中心基础设施两个星期前的状况呢?我通过传感器就可以及时掌握基础设施当前的状况了呀。”产生这种感觉并不是偶然的。

14890274725926.jpg

CFD开始进入数据中心领域

CFD最初进入数据中心领域大约是在10至15年前。彼时,数据中心的功率密度才刚刚开始上升。当IT设备由于过热问题而发生故障运行失败时,数据中心运营人员们发现很难理解其中的原因所在,因为他们缺乏相应的数据来分析这些问题。而这就是CFD的来源:操作运营人员聘请相关的工程顾问来模拟他们的基础设施,告诉他们究竟出了什么问题。

大约三个星期后,这些聘请的工程顾问将返回一份报告,该报告显示了基础设施中的环境。不变的是,这些报告将包含温度面板或显示周围环境的温度视图。

对于许多操作运营人员而言,这是他们第一次实现了对于其基础设施环境的可视化。通常,这是第一次能够看到相应的条件在数据中心操作空间内的变化,提供了巨大的价值。

此外,CFD模拟允许跟踪问题的来源,深入了解基础设施的运行情况。工程顾问们将与运营人员合作,以找到解决方案,然后在执行该方案之前在模型中进行模拟显示,充分利用该技术的预测功能。

开发实时数据

随着时间的推移,市场上开始出现了能够让操作运营人员们实时看到数据中心中所发生的情况的监控系统。这些系统的制造商们必须找到一种以简单易懂的方式呈现来自许多(可能至少100个)单个传感器的数据的方式。他们选择使用一种称为插值的过程来尝试加入传感器之间的点,并创建操作温度视图,这看起来非常像操作运营人员们曾经看到的CFD模型的输出。

在这一点上,考虑一下当操作运营人员们在执行CFD分析时,所提出的主要问题真正意味着什么是值得的:我企业的数据中心到底发生了什么?他们可能已经获得了关于为什么会发生这类情况的答案;以及如果数据中心执行了从CFD模型中所获得的益处,会发生什么情况的答案,但这并不是思维过程的主要推动力。就市场而言,由已经使用的监测系统所提供的温度视图就可以回答这个问题,而不需要专门聘请一名昂贵的顾问。其还有一项额外的好处是,能够显示当前发生的事情,而不是三个星期前的。

我们当前的发展阶段

使用CFD作为工具来获取其基础设施中所发生的情况的快照的数据中心操作运营人员得出了一套结论,即:他们可以通过现代监测技术实时获得几乎相同的信息,而无需花费额外的费用(然而,CFD分析将总是能够给你比监控系统更多的信息)。因此,CFD将被删除,因为其不再是必要的。

我对此表示赞同。

与监控系统相比,如果您用来为您的数据中心的操作环境条件进行快照,那么CFD是昂贵和麻烦的。但有一点需要注意的是:CFD真正的益处在于其能够回答“为什么”及“如果”的假设场景的能力。

监控系统的引入允许数据中心的性能得到大幅改进,因为在运营过程中当发生超出限制的情况时,其能够向运营人员们显示出来。并非提供相同的数据,CFD建模能够添加新的信息到操作人员的资源库。使得未来的计划可以进行压力测试和优化,而这是任何其他技术所无法做到的。这样做将允许进一 步推进数据中心的封装,能够利用更多的容量,并充分利用冷却系统的效率,而不会给IT负载带来风险。

案例研究:金融机构

为了说明借助其可以实现的目标,我想在接下来分享一个例证。该项目的目标是分离大约150台旧的直接冷却的前端为玻璃材质的机柜,并将这些机柜更换为更现代的热通道/冷通道布置,以便能够更好地利用可用的冷却。这相当于该处数据中心设施中大约50%的服务器机柜。同时,额外的200kW的工作负载将被从其他站点的服务器机房迁移到大厅,使得负载总数将从900kW增加到1.1MW。工作将在20个周末进行,使得数据中心的其余能够保持功能的完整和弹性。

首先,我们模拟了前20个阶段的每一个的终点,以确保计划是健全的。这项步骤突出了在地板上的许多电缆托盘需要被移除,因为它们将直接位于新的冷通道下方,会影响到气流。

然而,真正有趣的部分是:一旦工作开始上马后(而且情况往往总是如此),实际工作进程很快偏离了原来的计划,因为应用程序必须在计划移动时保持运行。我们与项目团队现场合作,利用每个周末实际完成的工作和下周末的新计划更新CFD模型。之后,我们运行了一个新的模拟,为迁移团队提供每台新的机柜的安全负载限制。这些每周的安全限值通常明显小于每台机柜的最终设计负载。

该项目在计划预计的时间内完成,没有发生一次单一的热停机(thermal shutdown)。这是因为迁移团队知道确切的限制在哪里,并且可以放心地接近该限制,因为以前已经模拟了每种情况。在不使用模拟的情况下,不会出现这种情况,并且将会超过限制(导致热停机)或每周安装的设备更少(延长项目执行的时长)。

互补而不竞争

CFD所提供的数据可以使数据中心性能实现增加监控系统在过去十年中所能够实现的的相同飞跃。虽然市场有良好的理由将CFD和监控视为互相竞争的技术,但它们实际上是完全互补的。随着数据中心操作运营人员们被要求以更少的成本做更多的事情,他们将需要这二者的协调努力来实现他们的业务目标。(来源:机房360)



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

目录
相关文章
|
2月前
|
物联网 测试技术 持续交付
持续部署的内涵和实施路径问题之持续部署过程中需要控制过程成本并保持高效的问题如何解决
持续部署的内涵和实施路径问题之持续部署过程中需要控制过程成本并保持高效的问题如何解决
|
3月前
|
安全 物联网 物联网安全
物联网设备的安全性评估与测试:技术深度解析
【7月更文挑战第7天】物联网设备的安全性评估与测试是保障物联网系统安全运行的重要环节。通过实施全面的安全性评估与测试,可以发现并修复设备中存在的安全漏洞和风险,提高整体安全防护能力。然而,由于物联网设备的多样性和复杂性以及安全标准与监管的缺失等挑战,测试工作需要不断创新和优化。未来,随着技术的不断进步和实践的深入,物联网设备的安全性评估与测试将更加完善和高效。
|
5月前
|
存储 运维 安全
云擎技术-云终端和传统PC端在搭建机房时,究竟双方各有优势还是一方占优呢?
云终端在成本和安全性问题优于传统PC,在性能方面,传统PC优于云桌面,所以建设机房重要的是怎么是出于什么应用场景,根据场景灵活选择配置云终端还是传统PC端。
69 0
|
物联网 UED
浅谈物联网用户体验目标的变化
随着新技术的不断涌现,设计师学习和实践的不仅仅是设计技能,还有运营技能、产品技能,更要有发现、分析和解决问题的技能。物联网不管是智能设备还是APP端,我们更期望它只是一种延伸或者说它是一种偏向于情感的表达,更丰富于我们现在产品的一种体验,未来肯定是一种常态
497 0
|
网络协议 Unix 测试技术
模拟恶劣网络环境常用的几种解决方案
一、利用Fiddler模拟恶劣网络环境   在解决日常的支持需求中,经常会遇到一些用户反馈一些无法简单复现的bug,有很大一部分的bug是由于用户自身的网络环境波动,或者是本身网络环境就较为恶劣,而服务在面对这种恶劣的网络环境的健壮性不够,导致会出现一些意想不到的bug。
2070 0