高密度数据中心内的配电即系统

简介:

曾几何时,为了能够积极主动地管理不断上涨的电力成本,使得数据中心内的配电系统俨然成为了数据中心运营商们的一大主要的关注领域。更具体地说,其是为了帮助操作运营人员们实时的识别运行过程中的电力消耗的潜在问题,并杜绝浪费。而随着越来越多的具备未来思维的企业组织开始广泛的分享他们在设施和IT管理过程中所总结的知识和经验,使得这种基于机架的电力基础设施中推动了更加的智能化已然变成了更高的机架功率密度的当务之急。事实上,在企业数据中心内的分配链中的所有阶段实施积极主动DE 电源管理已经成为效率研究和数据中心基础设施管理(DCIM)风格优化倡议的要求。

现代数据中心

多年来,数据中心运营管理人员们所唯一高度关注的问题便确保数据中心服务的持续正常运行。企业数据中心内部的IT部门几乎很少关注电力资源消耗和冷却方面的议题,因为这些资源似乎是无限的,并且往往被认为是基础设施团队的负责范围。IT专业人士只知道电力资源是可用的。数据中心业界的所有人都关心SLA和正常运行时间的问题。 “实现5个9的可用性”,是一个常见的需求,而几乎不用担心成本,电力使用或效率。基础设施服务的设计和管理仅仅只是关于冗余,而且电源和冷却系统的过度配置已然成为了标准的做法。长期以来,企业组织仅仅只是简单地将预算分配给数据中心业务部门,但却并没有详细掌握这些资金到底是如何使用的。IT就像是一个黑盒子和一张空白支票。随着业务需求、密度和计算需求的增加,这种运维已然被证明是不可持续的,且必须改变。

几年前,我们就已经注意到,几乎很少有企业组织不关注于效率、监控、电力成本或“绿色环保”方面的话题讨论。市场的竞争压力、政府部门的干预和一定的常识驱使企业组织为了生存,需要完全了解其每款IT设备所被部署的具体位置、提供的服务、以及每瓦特的功率到底被消耗到了哪些地方。有了这一组目标,下一步通常便是进一步分析市场上广泛的DCIM解决方案中的其中之一。

在过去的三年中,整个业界通过加强整合和建立更高密度的数据中心,进一步收紧了数据中心的电源预算。曾经42U 5kW的机柜是业界的普遍标准,而许多更新的数据中心现在采用的则是45U-52U 17kW的机柜。此外,这些数据中心正在以高度模块化的方式构建,同时人们也理解了需求的增长可以是快速和不可预测的。

PDU作为一款系统

配电的系统方面是什么?其开始于能够将大量的PDU(配电单元)设备作为单个系统处理。单个智能PDU,就像数据中心内的其他设备一样,必须借助操作系统更新、功能/安全补丁以及配置详细信息实施维护。当将电源分配看作一款单一的系统时,必须消除对单个系统的这种要求;然而,系统还应该保持对来自各个组件设备自身的所有高度智能化功能特征的访问。这可能包括高精确度的功耗报告,远程访问指标和功率状态的功能,以及在许多情况下在设备级别开关电源的高度安全的手段。

对于一款完整智能化的、能够提供简单的配置、多功能报告、容量规划和无缝集成的能源监控系统的需求,是任何大规模数据中心电源解决方案的关键性要求。每台机架内的电源分配设备是通向IT设备负载的电力链中的最终链路,故而机架PDU是用于精确测量诸如绿色网格组织所推荐的PUE值或最新的DCeP指标的最佳位置。随着数据中心的效率工作团队持续的能耗测量工作的开展,同时业界的相关机构也在持续不断的发表以数据中心以能源议题为中心的白皮书,如绿色网格组织的《数据中心PUE测量建议》和ASHRAE的《数据处理环境——热处理指南》 ,使得企业组织积极主动的管理能源消耗,并通过诸如PUE和DCeP等关键绩效指标获得对于其能耗测量结果的相关基准支持得到了越来越多的支持。

许多其他方面议题的白皮书也不断发表,议满足数据中心的效率目标,这些议题包括配电策略、功率链配置、设备规格、冷却方法、以及监控这些参数的软件工具。但往往被忽视的一点则是:没有以一种连贯的方式将大量类似的组件作为一个单一的实体来实施监视、管理和控制。

本文中,我们将为广大读者们介绍如何借助简单的配置将几十、几百或甚至几千台机架PDU作为一个单个连续层进行管理。正是这个电源层通过多功能报告提供了关于数据中心内的IT负载的能源使用信息,然后用于PUE、DCeP及其他指标。本文还将为您展示如何部署和配置一款适当的能源管理系统,以便在高密度数据中心消除容量规划监测能力方面所需涉及的大量的时间和压力,并提供了被绝大多数全球性的跨国企业所计划和实施的与持续DCIM无缝集成的额外的方法。

电源层的挑战

当前,数据中心行业所面临的挑战可以说是昨天的挑战的延伸。机架PDU电源层被视为现代数据中心最重要的组件之一,并且,一些新的解决方案在几大关键领域正在被评估:

● 适用于大量机架式PDU的系统方法

● 在更高操作温度环境下的可靠性

● 整个数据中心的功率和设备密度的提升

● 机架/机柜内的设备级电源监控

● 能量度量指标的准确性和深度

● 安全状态控制

● 环保意识

● 版本控制/设备管理和配置

● 对DCIM的支持

● 整体价值

系统方法

如前所述,为监控和管理电源层设备增加智能化以加强对能源使用、效率和成本的了解,为管理这些设备创造了额外的责任。对于机架PDU而言,有必要找到进行硬件更新和配置的有效手段,以及如何从该硬件获得大量测量数据的有效手段。

可靠性

即使业界目前开始关注起效率问题了,但正常运行时间和硬件可靠性的目标将继续成为任何依赖于其数据中心运营的企业组织的首要任务。配电链的任何部分,包括机架式PDU,必须在面对所有压力的情况下保持预期的长期质量和可靠性,以充分考虑在数据中心所花费的每一分钱。好的数据中心设计师和运营人员们都知道这一点,并都在寻求这样的高质量设备。随着整个业界开始要为更高的密度要求(每台机架/机柜高达20kW)和更高温度的“热通道”(60摄氏度或更高)做好准备,这一点变得更加重要了。

功率和设备密度的提升

“以更少的付出换得更多的收益。(Getting more for less)”已然成为许多领先的以“大数据”驱动的数据中心的口头禅。他们正在将更多的设备打包到更少的数据中心操作运营空间中,并且利用更多的功率,而不管单款设备的效率如何。这种高密度的数据中心模型需要一种模块化方法来延迟资本支出,直到绝对需要。在这种情况下,至关重要的是要精确地了解功率在功率分配链中的各个级别的使用情况,并尝试预测好时间以增加容量。

设备级电源的监控

为了获得数据中心中最详细的功耗信息,管理人员必须从使用点获取相关的指标。从PUE / DCeP的角度来看,这最好是在IT设备的输入处完成。具有出口级测量的机架PDU允许企业组织实现此目标。凭借有关设备的实际使用的信息,数据中心/ IT管理人员可以做出更好的决策,而不仅仅是使用哪些设备,而且还要考虑何时使用特定的应用程序。从长远来看,对这些信息的分析有助于充分优化电力和IT基础设施的利用率。

能量度量的准确性和深度

所选择的PDU的可用的度量指标的准确性和细粒度是非常重要的。虽然先前几代的PDU很少或几乎没有功率监测功能,但是获得高度细粒度和精确的测量要求对于持续的优化是至关重要的。虽然许多早期的智能化PDU可能包括安培数作为唯一的度量指标,但是最先进的功率处理设备包括能量感知的整个范围:在PDU内的多个位置的安培、电压、瓦数、功率因数、能量(kWh)等。这些都是非常重要的,有助于帮助企业数据中心管理人员理解在何处、何时、以及如何有效地利用电力资源;并根据数据中心所支持的业务需求的变更、改进和增长做出相应的决策。

安全状态的控制

在数据中心内控制对所有设备的安全访问的手段是相当重要的。具有可切换插座的机架式PDU可以解决这一挑战,并允许设备重新启动,插座锁定,固件重新加载等。对于许多企业客户而言,插座级控制是数据中心管理员们常常关注的问题。需要安排恰当的人员在恰当的时间获得访问权限 ——而没有例外。在这些控制点只应考虑最高级别的安全。

环境意识

了解数据中心机架/机柜内的环境条件,特别是随着功率密度的增加,也是数据中心管理人员们所关注的一大问题。支持环境传感器的轻松部署,而不必消耗大量的硬件、线缆或成本是与机柜内的配电设备天然适合的。传感器可以提供关于相关联的功率如何转换成热量的直接反馈,以及其中的哪部分被转换成浪费的热量的间接反馈。

版本控制/设备管理和配置

机架PDU上的智能监控和管理通常来自嵌入式固件。这样的固件,就像你企业的通用计算机软件那样,通过版本的修订添加功能或修复错误。至关重要的是,其是以受控的方式进行管理的,以保持其可靠性和安全性等重要因素达到相应的标准。由于PDU存在于跨企业部署的每台机架中,因此必须维护或更新的附加设备的数量变得相当惊人。故而企业组织所选择的能量管理系统应该允许能够简单方便地维护整个PDU。

DCIM支持

智能化的机架PDU与功能强大的能源管理系统相结合,是企业组织在计划未来几年的任何形式的DCIM工作的要求。 DCIM本身便是一个快速增长的细分市场,其依赖于电源层的智能化创造出大量的价值。对于一些企业组织而言,完整的DCIM解决方案是一次性的需求;但对于其他企业组织来说,成本和时间的初始支出导致他们需要缩减到更易于管理的能源管理系统解决方案。对于选择慢启动的企业组织来说,选择一款能够轻松集成到完整的DCIM解决方案中的能源管理系统是非常重要的。

整体价值

选择具有所有所需功能的机架PDU是一回事;而配置、安装和部署这些机架PDU,以便实现电源监控和管理的目标则又是另一回事。易于设置和日常使用信息流已经成为数据中心中的主要关注点。缺乏相应的计划和恰当的工具,会很容易在这些监测任务中落后。故而这就是选择准确、可靠、易于使用的PDU和能源管理系统所能够发挥其用武之地的时候了。掌握必要的数据以便在数据中心做出决策,用最少的资本投资和时间投入,提升整体价值。数据中心能耗智能化考虑到上文中所列出的一系列的挑战,很明显,当您部署一看智能化的配电系统与设计良好的能源管理系统协作时,肯定会带来巨大的价值。您数据中心将获得了巨大的能源意识水平,而正是这种能源意识直接为所有正在进行的DCIM计划做出了贡献。您可以在机架级别了解和管理数据中心电源的所有方面,而不会招致不合理的新的管理开销。如果这些事情被明智地选择,您可以获得轻松的配置,多功能的报告,容量规划和无缝集成以及许多其他有价值的工具。

简单的配置

除了设置阈值之外,基于测量点的警报只有当电力系统的部分被正确命名时才有意义。为此,基本的资产管理通常被内置在能源管理系统中。此外,一些系统允许用于设备的固件版本控制、通信链路控制和访问控制的更详细的配置管理。

多功能报告

仅仅是偶尔对数据中心中的功率使用情况进行测量,就声称对其有了了解是不够的。采用绿色网格组织所推荐的PUE和DCeP指标来对IT设备负载进行持续的测量,对于真正理解数据中心所使用的容量以及了解功率链中每一步的功率使用趋势是非常重要的。精心设计的能源管理系统将提供数据输出,以减少每日,每周和每月任务的工作负载,而不会增加繁琐的维护任务。

容量规划

实施能源管理系统的常见原因之一是容量规划,特别是在高密度模块化的数据中心。不仅要了解有多少功率可用,而且还需要确切地了解哪些电路可用,这对于优化数据中心基础设施的使用是非常重要的。机架式PDU的监控是理解整个数据中心的电源使用细分的最佳位置。不仅可以使用在机架/机柜处的测量来理解分支电路的容量开销,而且,通过适当地聚合汇总,可以对上游各阶段所分配的安培数进行预估。

无缝集成

虽然对于许多企业组织来说,对于能够将数据中心内的所有设备的监视和管理纳入到一款单系统的渴望还在继续,但是对于许多企业组织而言,当今可用的专用工具已经以最好的价格提供了既定的的值这一事实已经是变得非常清楚的了。这些工具可以集中在诸如机架配电层、网络层、服务器利用层或冷却控制层之类的任何一层上。这些专业工具的最重要的方面是,当需求出现时,他们能够很容易集成到那些更大的DCIM或BMS系统中。

电源管理

控制数据中心中插座的电源状态的功能在一些行业中是有争议的,而在其他另一些行业中则是非常重要的。无论是重新启动锁定的服务器还是远程位置的交换机,关闭未使用的插座,以避免数据中心中的电路意外过载,或在实验室应用程序中提供计划的插座使用,切换插座均有其用武之地并且肯定具有其价值。凭借高级别的安全性和用户身份验证,一些机架式PDU符合这一挑战,并结合了安全的插座状态控制功能。选择一款具备基本资产管理的能量管理系统可以允许实现单个插座的方便的开/关/重新启动命令,群组插座代表了一款单个设备,集群插座则代表了一组设备。电源链的完整性和冗余性

能够监视从PDU到服务器的电力链中的每个设备是所有数据中心的共同的目标。然而,当涉及到部署实施时,成本问题将成为一大因素。如果数据中心只能在一个地方进行测量,则在机架/机柜中使用智能PDU进行测量是获取最多信息的最佳方式。

一款能源管理系统应该能够提供在机柜/机柜的功率测量的适当的聚合。这可以帮助证明在机架/机柜以及在配电链中的上游点的冗余。

警报管理

如果阈值警报管理不当,就无法实现很好的电源监控。一种简单的,实现大规模的多架PDU配置阈值的方法是很有价值的。此外,其通常需要类似设备的所有报警可在一个位置访问。一些能源管理系统有这种功能和能力,显示报警条件,并转发到其他系统。故障排除

相当多的情况下,数据中心的运营维护工作主要都是“救火”。当紧急情况通过报警显示时,第一时间了解导致报警的紧急情况的进展变得非常重要。高电流、断路器、设备——这些对于试图最大限度地维持数据中心的正常运行时间的人员是至关重要的。快速的响应报警是非常重要的,但最好是在一开始就能够防止这些条件发生。只有通过持续的监控,才能学会如何防止电力系统故障的复发。

总结鉴于当今的市场的压力,使得数据中心的管理人员们在试图应对电力挑战方面产生了巨大的紧迫性。识别包括最高质量和可靠硬件的数据中心内的电力分配系统,以及将以及这些系统连接在一起的能量管理系统显然是关键的第一步。当选择这种电力系统时,必须考虑战术和战略方面的要求。SPM提供了一种易于管理的系统,不管涉及的具体拓扑或规模如何,在机架级提供高度精确和细粒度的监控指标,允许进行高度安全的状态控制,报告在PDU附近的相关环境信息,并允许实现跨企业组织所部署的数百或数千个设备的简单和持续的配置和固件版本控制。

虽然来自能源管理系统的丰富信息本身将是有价值的,但是对于数据中心电源的最有能力的系统将专门设计用于为正在进行的数据中心管理任务提供ITSM和DCIM解决方案。最后,在数据中心的所有业务需求方面发生的快速变化要求电力系统必须能够立即开始构建智能化,因为今天的任何收购都将是跨动态计算,DCIM和未来数据中心的大部分愿景的时间框架的。

数据中心电源管理器从根本上设计成为行业内最具吸引力的能源管理系统,具体能够支持各个组件的持续管理,以及提供最准确和详细的功率指标 。其将有助于您企业规划,实施和改进任何类型和任何规模的配电基础设施。

本文转自d1net(转载)

相关文章
|
2月前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
73 4
|
8月前
|
机器学习/深度学习 存储 运维
利用机器学习优化数据中心冷却系统
【5月更文挑战第20天】 在数据中心运营成本中,冷却系统占据了一大块。随着能源价格的上涨和环境保护意识的增强,如何降低数据中心的能耗成为行业关注的重点。本文通过引入机器学习技术来优化数据中心冷却系统,旨在减少不必要的能源消耗,同时保持适宜的操作温度。通过收集历史温度数据、服务器负载信息以及外部气象条件,构建了一个预测模型,该模型能够实时调整冷却策略,实现动态节能。实验结果表明,与传统冷却系统相比,应用机器学习优化后的系统在不影响性能的前提下,能够节约高达20%的能源消耗。
|
8月前
|
机器学习/深度学习 存储 传感器
利用机器学习优化数据中心冷却系统
【5月更文挑战第30天】 在数据中心的运行中,冷却系统的能效对整体运营成本有着显著的影响。随着人工智能技术的进步,特别是机器学习(ML)的发展,出现了新的机会来优化数据中心的能源使用效率。本文将探讨如何通过机器学习模型预测数据中心的热负荷,并据此动态调整冷却策略,以实现能耗最小化。我们将介绍所采用的数据集、预处理方法、模型选择、训练过程以及最终实施的策略。结果表明,基于机器学习的预测系统能够有效降低数据中心的能源消耗,并为可持续运营提供支持。
|
8月前
|
机器学习/深度学习 监控 算法
利用机器学习优化数据中心冷却系统
【5月更文挑战第30天】在数据中心的运营成本中,冷却系统占据了相当一部分。为了提高能效和降低成本,本文提出了一种基于机器学习的方法来优化数据中心的冷却系统。通过对大量历史数据的分析和挖掘,我们设计了一个预测模型,用于实时监控和调整数据中心的温度。实验结果表明,该方法可以有效降低能耗,提高数据中心的运行效率。
|
8月前
|
机器学习/深度学习 数据采集 存储
提升数据中心能效:采用机器学习优化冷却系统
【5月更文挑战第28天】在数据中心的运营成本中,冷却系统的能源消耗占据了显著比例。随着能源价格的不断上涨和可持续发展的需求日益增长,如何降低这一开支成为业界关注的焦点。本文将探讨利用机器学习技术对数据中心冷却系统进行优化的方法。通过分析历史数据和实时监控,机器学习模型能够预测冷却需求并动态调整系统设置,以实现最佳的能效比。这种方法不仅能减少能源消耗,还能提高系统的可靠性和稳定性。
|
8月前
|
机器学习/深度学习 传感器 监控
利用机器学习优化数据中心冷却系统
【5月更文挑战第27天】 随着数据中心能耗的不断攀升,尤其是冷却系统的能源消耗占据了相当一部分比例,如何通过智能化手段提高冷却效率成为行业关注焦点。本文提出了一种基于机器学习技术的数据中心冷却系统优化方案,通过实时监控和数据分析,动态调整冷却策略,以达到节能减排的目的。实验结果表明,该方案能有效降低数据中心的PUE值(功率使用效能比),为绿色计算提供可行的技术路径。
|
8月前
|
机器学习/深度学习 存储 监控
利用机器学习优化数据中心冷却系统
【4月更文挑战第28天】 在数据中心的运营成本中,冷却系统的耗电占据了显著比例。随着能源价格的上涨以及环境可持续性的重视,寻求高效的冷却策略变得尤为重要。本文将探讨如何应用机器学习算法来优化数据中心的冷却系统性能。通过分析历史温度数据、服务器负载和外部环境因素,机器学习模型能够预测数据中心内的热分布,并实时调整冷却设备的工作状态,以达到节能的目的。我们的研究显示,采用这种智能调节方法可以显著降低能耗,同时保持或甚至提升冷却效果。
89 1
|
8月前
|
机器学习/深度学习 算法 数据中心
利用机器学习优化数据中心冷却系统
【5月更文挑战第29天】 在数据中心的运营成本中,冷却系统占据了显著的比重。随着能源价格的不断攀升以及可持续发展的需求日益增加,开发高效、节能的冷却技术变得至关重要。本文将探讨如何应用机器学习算法来优化数据中心的冷却系统性能。通过对历史温度和负载数据的分析,我们训练了一个预测模型来动态调整冷却需求,实现按需冷却。结果显示,使用机器学习方法可以有效减少能耗,同时保持适宜的操作环境。
|
8月前
|
机器学习/深度学习 敏捷开发 测试技术
深入理解自动化测试:框架选择与实践挑战利用机器学习技术优化数据中心冷却系统
【5月更文挑战第27天】 在现代软件开发周期中,自动化测试已成为确保产品质量和加快市场投放的关键步骤。本文深入探讨了自动化测试的框架选择问题,并剖析了实施过程中面临的挑战及其解决方案。通过比较不同测试框架的特点,我们旨在为读者提供一套明确的指导原则,帮助他们根据项目需求做出恰当的技术决策。同时,文中还分享了实际案例和最佳实践,以期帮助开发团队克服实施自动化测试时可能遇到的障碍。
下一篇
开通oss服务