DCIM技术之一:数据中心运营商需要什么样的DCIM-阿里云开发者社区

开发者社区> 大数据> 正文
登录阅读全文

DCIM技术之一:数据中心运营商需要什么样的DCIM

简介:

摘要:如果你询问数据中心行业人士,什么是数据中心基础设施管理(DCIM)?那你可能会得到一些不同的答案。虽然DCIM有很多正式的和非正式的定义,但DCIM工具并没有正式的分类,因此数据中心业主运营商很难区分“必须有”哪些更好的风险管理功能和效率,而这些功能是可选的,但其真正提供的价值却很少。

本文将研究使用和实现数据中心基础设施管理(DCIM)的主要挑战。

DCIM是什么?

如果你询问数据中心行业人士,什么是数据中心基础设施管理(DCIM)?那你可能会得到一些不同的答案。虽然DCIM有很多正式的和非正式的定义,但DCIM工具并没有正式的分类,因此数据中心业主运营商很难区分“必须有”哪些更好的风险管理功能和效率,而这些功能是可选的,但其真正提供的价值却很少。在市场上还有许多DCIM工具,为数据中心链不同的学科提供不同的重点功能。总的来说,这些工具也被称之为DCIM。

  图1监控管理数据中心的DCIM

图1显示了数据中心的主要DCIM领域,从发电机、电力室、数据大厅和IT设备,另外还配置了集安全性和一体化的楼宇管理系统(BMS)。DCIM系统可以对数据中心区域提供监控和管理服务。

DCIM的演变

在2007年绿色网格组织采用PUE度量数据中心能耗之前,数据中心的业主运营商对跟踪数据中心的能耗很少感兴趣。PUE的出现改变了组织对成本效率和社会责任的态度,而监管机构专注于数据中心的能源消耗,因此带动了企业更多的关注。数据中心管理者可以提供更高的安全性和24×7更高的可用性,以满足他们的客户。通常情况下,数据中心所有者的客户将要求他们的足迹、效率和交付成本具有更高的可视性。

  图2 PUE监测

一些早期监测PUE的BMS系统和仪表是DCIM进化的先驱。随着时间的推移,DCIM已经演变成一个大的分类系统,不仅能监测能源消耗,还有对资产控制、容量管理等专业功能。这种进化导致其产品可以推向市场更广泛的用户,但系统的功能描述和潜在的好处往往令人混淆。在市场的角落里,充斥着的都是旨在管理、监控和优化能耗,以及监测PUE的传统的BMS平台和产品。而综观目前的DCIM市场作为一个整体,一个供应商的DCIM与其他厂商有所不同,这是很常见的。供应商们声称能提供DCIM,然而却提供的是完全不同的产品,只是在数据中心中侧重于不同的功能。

BMS系统和DCIM之间的区别

传统DCIM的目的是帮助数据中心的业主和运营商管理和控制他们的设施。人们印象中楼宇管理系统(BMS)是DCIM的最基本的表现(见图3),提供了一个可以看到对数据中心的监控,报警和控制。随着数据中心业务变得更加复杂,数据中心所有者和运营商要求提供更多的功能。

  图3 楼宇管理系统(BMS)的工作流模型

在业界已经有许多不同的模型描述了DCIM工作流(见图4)。他们中的大多数认为大规模收集来自传感器和仪表的数据和存储。这个数据被用作输入到子系统分析,如环境控制、功率和能量管理、安全性,以及IT系统。并为数据中心操作者将输出显示在仪表上。此输出结果是否可以提供可操作的信息,或只是用五颜六色的计量数据表示是必须解决的问题,将更多的功能整合到DCIM系统中,并成为数据中心运营和管理使用制度。而解决这些问题对于数据中心运营商来说是提高了价值(如果有),DCIM在这方面将会超越BMS系统平台。

  图4 DCIM的工作流模型

目前,大多数DCIM产品难以解决这些重大问题,因此这也促使数据中心的业主对此进行投资建设(见图5)。

  图5 数据中心业主提出的主要问题

没有人可以准确定义描述DCIM或DCIM应该做些什么。而一个错误的假设是,DCIM将修复你的数据中心,因此在图5中的第一个问题是DCIM产品在市场上的虚假陈述的问题。现实情况是,DCIM的一个最基本的功能应该是对于基础架构的性能和需要关注的突出问题提供一个更为深刻的见解,并解决重大风险。最值得注意的是,这些领域包括数据中心是否在设计意图实施,基础设施的容量限制(“瓶颈点”),资本项目的评估,确定闲置的容量,并为下一次部署的服务器分配一个合适的位置。

DCIM适合哪些组织结构?

数据中心包含两个不同类别的专业团队:IT人员负责在数据中心的IT设备(即服务器和网络交换机)和基础设施团队负责该数据中心设施和空间。基础设施团队管理维护设备,而IT人员运行业务和IT设备。在数据中心的日常运营中,这两个团队将在管理和运营上变得越来越紧密(见图6)。在每个不同的“实干者和管理者”的人都需要从相同的DCIM系统得到不同的信息。

  图6 数据中心设施链和不同团队的职责

正如已经提到的,在设施水平的挑战是确定现有的系统平台,DCIM提供效益的差异。传统的BMS系统位于图6中的数据中心链设施左侧,在某些情况下,可以监测数据中心的健康,并控制一些数据中心设施。

在责任链中,工程技术人员和/或现场操作人员对于C级的管理的功能和信息需求可能有所不同。工程技术人员可能会对企业的高水平性能指标感兴趣,尽量减少运营支出,而站点级或现场操作人员将重点放在降低本地数据中心的风险,并评估资本项目的可行性。

DCIM产品正试图解决工作流程的自动化。例如,当一个IT经理确定需要部署IT服务器,其运营和设施必须进行分配并提供适当的空间,电力和冷却设备。DCIM的核心关系正试图在这里解决IT和设施团队之间的重要互动。该要求是数据中心设施人员和IT人员,以及运营商和高级管理人员之间进行双向互动。这种协调和信息的“流”是最主要的途径之一,精心设计和实施DCIM系统创建了一个主要的组织利益和提供投资回报(ROI)测量。

最近,DCIM供应商进行了一个ROI案例试点项目,如采用气流遏制和/或更高的工作温度。不用说,这些方案不一定需要DCIM,并且可以通过现有的BMS或设施来实现。

剖析DCIM的不同组成部分

BMS和DCIM之间最显著一个的差异是输出的可视化,而可见性是数据中心管理的第一要素。该用户给出了一个仪表板(见图7),可以根据自己的要求进行定制,并显示有意义的信息,这可能与数据中心子系统、物理资产、容量和站点警报有关。一些厂商更深入地了解其IT设备的仪表盘,而另一些厂商则更专注于机械和电气基础设施。

  图7 现代DCIM复杂的仪表板

例如,一个数据中心管理人员可能更愿意看到数据大厅的平均温度,IT负载和PUE值,而另一个管理人员可能更愿意看到的每周的能源成本指标、经营业绩指标,以及数据中心最重要的几个警报。图8显示了六个必须具备的DCIM功能:其中包括监控、资产管理、容量规划(无论是设施还是空间)、分析和报告,与其他系统的集成,以及整理其他DCIM平台数据的业务范围管理的能力。

  图8 六个DCIM功能

投资组合的管理解决了在全球投资数据中心的本地视图,并提供了查看数据中心资产、状态、能源和成本性能指标的能力。最好的仪表板提供概览或高级信息,更容易获得“向下钻取”到更具体的层的能力。

·监测

虽然将BMS系统可以部署监测的主要设备部件和功能,其中包括间隔、仪表配置、数据存储,以及可能超出其能力的数据分析。管理其主要子系,一个DCIM系统必须要追溯至过去的表现,同时继续监测正在进行操作的内在能力。这种能力需要可靠的仪表和传感器,并以适当的磁盘空间收集、存储和趋势信息。其应该监控的主要子系统是电力设施、环境参数、安全性和IT领域。

电力设施监测包括详细的电气参数,如不同子系统功率、电压和电流,从而使工程团队来管理和理解配电,并且还支持容量规划和设施扩建。环境控制包括监控所有的加、通风和空调(HVAC)子系统,包括消防、燃气及供水系统和控制。安防监控包括人员在数据中心的活动跟踪,包括识别。IT领域子系统应监测数据中心的空间、电力和冷却设备,数据中心运营商和客户服务水平的要求是不打折扣的的。许多DCIM系统提供允许读取单个IT组件性能的跟踪模块,提供有关利用、能耗等数据。

大多数DCIM解决方案的一个突出弱点是理念,仪表的参数都是动态生成的,但存储空间有限,这些数据通常会导致在一个月之后就丢弃,因为没有可用的数据,因此不了解其较长时期的趋势。在制定系统的设计要求时,必须考虑到数据中心信息管理与数据中心数据管理的区别,并把重点放在有用的信息与数据的收集上。

·资产管理

资产管理经常被人忽视,但却是DCIM的一个关键组成部分。数据中心可能包含数千个资产,从IT设备的电源、制冷基础设施、数据中心空间等,该过程可能涉及所有IT设备的清单,数据中心机架布局和柜U形槽的配置的模型。例如,快速定位空间中的服务器的能力,可以减少设备的维护周期,提高整体可用性。它不仅是关于定位设备,而且对设备的配置、电源、控制参数和维修间隔的详细信息。

·容量规划

通过DCIM在设施水平上可以洞察电气和机械设备的利用程度。能够在数据中心使用重要的资源是至关重要的,特别是那些特定的电源和冷却设备。一个数据中心的所有者在设计和建造了1000千瓦的数据中心设施,并打算使用其全部的电力容量。对计量数据在这些系统的进一步分析允许变更影响分析的电力和冷却基础设施。在数据中心空间中,其进一步的重点必须放在IT设备的最佳位置,可以通过电力和冷却设备的安装评估。对于托管的数据中心提供商来说,“能力”意味产生收入,所以管理这个“库存”是一个明显的关键功能的产品。对于企业数据中心的所有者来说,无论是对未来资本密集型扩张还是对运营成本控制和规划,管理能力同样重要。

·分析和报告

许多DCIM产品配备分析功能(通常是对用户隐藏的),该采用具有一些趋势和/或内置过去的数据,以确定数据中心设施变化的影响。虽然这些工具有助于确定数据中心宕机的能力,但输出是很难以解释的,并难以转化为可操作的变更管理计划。智能容量规划往往会推迟对未来下一个阶段或下一个数据中心的建设要求,从而节省数百万美元。人们对于许多DCIM解决方案的误解是,通过存储大量数据的功耗和IT负载的增长模式,当一个特定的子系统组件是接近极限,它可以预测其利用率,信号升级或投资项目的要求。事实上,这种方法忽略了主要子系统组件的未来IT负载增长的灵敏度以及不同的环境温度之间的复杂能量关系。

因此,其面临的挑战是必须高效率和及时处理庞大的数据量,并提供建议的形式和可操作的情报。这些信息必须考虑目标受众,并经过过滤。例如,网站管理员可以对风险项目和能源消耗更感兴趣,而作为最高管理层可能需要运行成本和即将到来的资本和维护项目网站的高级视图。跟踪“正确”的数据,并分析和转换该数据转换成有用的信息是至关重要的。CIM供应商应该帮助选择DCIM系统模块,满足数据中心业主的需求,而不是试图把无限的功能和模块,或者永远不会使用的功能添加这个系统中。例如,利用CFD来管理数据中心空间,并提供对数据大厅的影响和变化是非常有价值的。DCIM供应商的趋势不过是解决方案附加模块,提供某种形式的模型,而不是与独立的CFD软件进行组合。

·与其他系统的集成

一个明智的DCIM厂商将会意识到其DCIM的局限性。通常,DCIM产品中实施后,可能需要与现有的BMS系统集成,或者在传感器/仪表或处理器层面进行集成。例如,数据中心管理者可能是与BMS用户界面很好地整合,但可能发现在两个不同的软件平台查看会导致混乱。管理层将在硬拷贝或电子格式时,具有多年的跟踪和评估数据中心的性能报告。一个新的DCIM系统应该能够在硬件和软件水平进行系统的整合,包括连接到现有的仪表和传感器,并能够将现有的数据导入到镜像数据库。而从现有的BMS系统过渡到一个新的DCIM系统可能需要几年的时间,而DCIM供应商团队将是这一转型成功的关键。

结论

文中强调了数据中心的业主和运营商在庞大而仍在扩大的数据中心市场选择DCIM的挑战。DCIM的目的成为数据中心不同学科之间的沟通桥梁,并解决IT机构在数据中心运营和管理的挑战。

对于DCIM功能的广泛的审查突出了监测潜在的弱点、能力管理、分析和报告功能,这是DCIM超越传统BMS系统的关键的进步。选择正确的组合,这些先进的能力是一个关键,以最大限度地提高投资回报率,这是最终的目标。对DCIM产品的核心分析能力的局限性和能力必须对用户透明。在极端情况下的分析功能可以削弱处理大量数据的要求。选择不当的系统或设计不当的系统将无法呈现与组织的业务目标保持一致的形式的可操作的输出情报。

关键是要避免附加组件提供没有价值的业务,并只为打算使用的功能支付费用。数据中心的业主应考虑确定他们想迁移到DCIM系统完成的要求,在供应商进行产品的选择时,它们应该包括在需求定义中所有使用该系统的功能。另外,在选择正确的系统时,考虑聘请不偏向任何特定DCIM的顾问。

最重要的是注意现实与预期之间的差距。对于现有的数据中心,迁移到一个新的DCIM系统可能需要数年时间才能完成,更长的时间才能显示出可测量的投资回报率。关键是要评估供应商所提供的培训和支持以及系统的灵活性。


本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: