《云数据中心构建实战:核心技术、运维管理、安全与高可用》——1.3 数据中心分类与分级-阿里云开发者社区

开发者社区> 华章出版社> 正文
登录阅读全文

《云数据中心构建实战:核心技术、运维管理、安全与高可用》——1.3 数据中心分类与分级

简介:

本节书摘来自华章计算机《云数据中心构建实战:核心技术、运维管理、安全与高可用》一书中的第1章,第1.3节,作者:杨 欢 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据中心分类与分级

不同数据中心应用的系统、面向的服务对象、关联的级别各不相同,小型数据中心未必会配置双路市电输入和大型的柴油发电机;而大型的数据中心由于面临各种复杂环境的用户和ISP资源,并且需要7×24小时不间断服务,他们的数据中心不可能只有单一的某个点,对数据中心进行分类和分级可以更好地了解整个数据中心的运作。
1.3.1 数据中心分类
由于服务的对象、服务的质量、业务的规模等有所差异,当前数据中心主要根据以下几个因素进行分类。

  1. 关联级别分类
    根据企业的组织机构将数据中心分为单级数据中心和多级数据中心。

    • 单级数据中心是指企业或组织将业务系统集中化管理,只设立一个数据中心,不管是本部,还是分支机构的客户端都通过相关通道连接内部服务。
    • 多级数据中心是指企业或组织以多层次、分布式的模式建设的数据中心,总部部署一级数据中心,下级单位建立二级数据中心、三级数据中心……

单级数据中心多为中小型企业应用,多级数据中心则多为大型企业、科研机构等。

  1. 服务对象分类
    根据服务对象的不同将数据中心分为企业数据中心和互联网数据中心。
  • 企业数据中心是由企业或组织自行构建,为企业内部员工、关联客户、合作伙伴提供数据处理、数据访问等信息服务,它可以是单级数据中心或多级数据中心,也可租用IDC机房,将IT运营运维外包给专业公司。
  • 互联网数据中心是由服务提供商所有,通过Internet向客户提供有偿信息服务。由于面向的服务对象更广,这类数据中心规模一般较大,设备和平台也较为高端。

1.3.2 数据中心分级
数据中心达到100%的可用性是每一个CIO和IT运维人员的终极目标,但是这并不现实,人为、设备、环境等因素都有可能造成服务的中断。冗余是避免单点故障的有效方法,但冗余并非是数据中心可用性的终极保障,下面我们来详细了解可用性分级标准。
《ANSI/TIA-942–2005,Telecommunications Infrastructure Standard for Data Centers》(数据中心的通信基础设施标准),简称TIA-942标准,是由美国通信工业协会(TIATR-42.2 委员分会制定,并由美国国家标准学会(ANSI)和美国通信工业协会(TIA)于2005年4月12日共同发布,它对数据中心建设定位、功能指标、设计技术、施工工艺、验收标准等技术进行了具体描述。

  1. 如何分级
    该标准中,根据The Uptime Institute Inc.的《Industry Standard Tier Classifications Define Site Infrastructure Performance 》、《采用分类等级的方式定义场地基础设施性能的工业标准》将数据中心划分为四个等级,分别为:Tier I、Tier II、Tier III、Tier IV。

(1)Tier I——基础级
该级别数据中心只有一组通信通道、一个供电分配系统、一组冷却系统,一套UPS系统,无架空地板,即便有承载力也较低。此类数据中心安全单点隐患较多,任意一个节点出现问题都会导致数据中心的非正常运转,因此这些基础设施每年至少需要完全关闭一次,以进行预防性维护工作。Tier I级数据中心的可用性为99.671%,也就是说,每年会有至少29小时的中断或维护时间。
(2)Tier II——具冗余部件级
相对于Tier I级数据中心,Tier II级数据中心增加了架空的防静电地板,并且配备了少量的冗余设备,比如UPS和发电机,它们的设计容量是N+1,对于计划性和非计划性维护引起数据中心中断几率要小于Tier I级数据中心,但是对关键供电分配系统和基础设施进行维护时仍然需要关闭设备,Tier II级数据中心的可用性为99.741%,每年中断时间低于22小时。
(3)Tier III——可并行维护级
Tier III级数据中心的在线维护能力大幅提高,它可以在不关闭计算机硬件设备的情况下进行计划性维护,计划性维护内容包括保护性的和程序式的维护、维修及元件升级替换,增加或者减少与处理能力相关的部件,对部件和系统进行测试等。但是对于非计划性的故障仍然会造成数据中心的业务中断。
Tier III级数据中心的冗余功能也不再局限于电气系统,通信、温控都具备冗余的组件,并且该级别数据中心的访问控制也非常严格,在人为因素上降低了故障可能性,Tier III级数据中心较之Tier II级数据中心的可用性大幅增加,达到了99.982%,每年中断时间低于105分钟。
(4)Tier IV——容错级
容错级数据中心需要考虑所有计划性的维护和存在隐匿的非计划性维护,所有的设备具备容错性、多重性、独立性,并以“双”的概念出现,两条供电分配系统、两个独立的(N+1)UPS系统+发电机组、两条通信线路等,即便是服务器的设备也需要双电源输入;另外,消防系统也采用了七氟丙烷气体灭火系统,并配备了火灾报警系统、紧急停电程序和完善的应急处理系统。
该级数据中心还对主区域进行了详细划分,进线设备间(ENTRANCE ROOM)、主要分布区域(MDA)、水平分布区域(HAD)、区域分布区域(ZDA)和设备分布区域(EDA)等,这些区域所需要的电力需求不尽相同,因此会划分为多级负荷标准。这样的分配可以使资源更加合理地应用,也使得某一区域的非计划维护不会对其他区域造成影响。
Tier IV数据中心的可用性需要达到99.995%,甚至更高,服务中断只有在计划中的预防性演习或者非计划的灾难应急停电的情况下才会发生,每年的中断时间不超过10分钟。

  1. 数据中心分级标准
    数据中心的分级秉承“就低原则”,举个例子,一个数据中心的基础设施除通信系统外其他部分的级别均为Tier IV级,但是通信系统只有Tier II级,那么这个数据中心级别只有Tier II。

还存在另外一种状况,我们知道数据中心存储的数据不尽相同,并非每一个字节的数据都需要99.995%的高可用性,例如文件共享、视频监控、培训资料等非结构化数据对可用性级别要求远远弱于业务数据,因此数据中心会采用多层级混合设计以降低运营成本,这时就需要对数据中心所有层级进行评估,估算计算数据中心的Tier I~Tier IV各层所占据的比例,进而判断其分级级别。
我国也对数据中心的级别进行了定义,根据国家规范《电子计算机机房设计规范》(GB50174—1993)将数据中心划分为A(容错型)、B(冗余型)、C( 基本型),在数据中心选址、区域结构、环境管理等方面进行了明确区分。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

华章出版社

官方博客
官网链接