《云数据中心构建实战:核心技术、运维管理、安全与高可用》——1.3 数据中心分类与分级

简介:

本节书摘来自华章计算机《云数据中心构建实战:核心技术、运维管理、安全与高可用》一书中的第1章,第1.3节,作者:杨 欢 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据中心分类与分级

不同数据中心应用的系统、面向的服务对象、关联的级别各不相同,小型数据中心未必会配置双路市电输入和大型的柴油发电机;而大型的数据中心由于面临各种复杂环境的用户和ISP资源,并且需要7×24小时不间断服务,他们的数据中心不可能只有单一的某个点,对数据中心进行分类和分级可以更好地了解整个数据中心的运作。
1.3.1 数据中心分类
由于服务的对象、服务的质量、业务的规模等有所差异,当前数据中心主要根据以下几个因素进行分类。

  1. 关联级别分类
    根据企业的组织机构将数据中心分为单级数据中心和多级数据中心。

    • 单级数据中心是指企业或组织将业务系统集中化管理,只设立一个数据中心,不管是本部,还是分支机构的客户端都通过相关通道连接内部服务。
    • 多级数据中心是指企业或组织以多层次、分布式的模式建设的数据中心,总部部署一级数据中心,下级单位建立二级数据中心、三级数据中心……

单级数据中心多为中小型企业应用,多级数据中心则多为大型企业、科研机构等。

  1. 服务对象分类
    根据服务对象的不同将数据中心分为企业数据中心和互联网数据中心。
  • 企业数据中心是由企业或组织自行构建,为企业内部员工、关联客户、合作伙伴提供数据处理、数据访问等信息服务,它可以是单级数据中心或多级数据中心,也可租用IDC机房,将IT运营运维外包给专业公司。
  • 互联网数据中心是由服务提供商所有,通过Internet向客户提供有偿信息服务。由于面向的服务对象更广,这类数据中心规模一般较大,设备和平台也较为高端。

1.3.2 数据中心分级
数据中心达到100%的可用性是每一个CIO和IT运维人员的终极目标,但是这并不现实,人为、设备、环境等因素都有可能造成服务的中断。冗余是避免单点故障的有效方法,但冗余并非是数据中心可用性的终极保障,下面我们来详细了解可用性分级标准。
《ANSI/TIA-942–2005,Telecommunications Infrastructure Standard for Data Centers》(数据中心的通信基础设施标准),简称TIA-942标准,是由美国通信工业协会(TIATR-42.2 委员分会制定,并由美国国家标准学会(ANSI)和美国通信工业协会(TIA)于2005年4月12日共同发布,它对数据中心建设定位、功能指标、设计技术、施工工艺、验收标准等技术进行了具体描述。

  1. 如何分级
    该标准中,根据The Uptime Institute Inc.的《Industry Standard Tier Classifications Define Site Infrastructure Performance 》、《采用分类等级的方式定义场地基础设施性能的工业标准》将数据中心划分为四个等级,分别为:Tier I、Tier II、Tier III、Tier IV。

(1)Tier I——基础级
该级别数据中心只有一组通信通道、一个供电分配系统、一组冷却系统,一套UPS系统,无架空地板,即便有承载力也较低。此类数据中心安全单点隐患较多,任意一个节点出现问题都会导致数据中心的非正常运转,因此这些基础设施每年至少需要完全关闭一次,以进行预防性维护工作。Tier I级数据中心的可用性为99.671%,也就是说,每年会有至少29小时的中断或维护时间。
(2)Tier II——具冗余部件级
相对于Tier I级数据中心,Tier II级数据中心增加了架空的防静电地板,并且配备了少量的冗余设备,比如UPS和发电机,它们的设计容量是N+1,对于计划性和非计划性维护引起数据中心中断几率要小于Tier I级数据中心,但是对关键供电分配系统和基础设施进行维护时仍然需要关闭设备,Tier II级数据中心的可用性为99.741%,每年中断时间低于22小时。
(3)Tier III——可并行维护级
Tier III级数据中心的在线维护能力大幅提高,它可以在不关闭计算机硬件设备的情况下进行计划性维护,计划性维护内容包括保护性的和程序式的维护、维修及元件升级替换,增加或者减少与处理能力相关的部件,对部件和系统进行测试等。但是对于非计划性的故障仍然会造成数据中心的业务中断。
Tier III级数据中心的冗余功能也不再局限于电气系统,通信、温控都具备冗余的组件,并且该级别数据中心的访问控制也非常严格,在人为因素上降低了故障可能性,Tier III级数据中心较之Tier II级数据中心的可用性大幅增加,达到了99.982%,每年中断时间低于105分钟。
(4)Tier IV——容错级
容错级数据中心需要考虑所有计划性的维护和存在隐匿的非计划性维护,所有的设备具备容错性、多重性、独立性,并以“双”的概念出现,两条供电分配系统、两个独立的(N+1)UPS系统+发电机组、两条通信线路等,即便是服务器的设备也需要双电源输入;另外,消防系统也采用了七氟丙烷气体灭火系统,并配备了火灾报警系统、紧急停电程序和完善的应急处理系统。
该级数据中心还对主区域进行了详细划分,进线设备间(ENTRANCE ROOM)、主要分布区域(MDA)、水平分布区域(HAD)、区域分布区域(ZDA)和设备分布区域(EDA)等,这些区域所需要的电力需求不尽相同,因此会划分为多级负荷标准。这样的分配可以使资源更加合理地应用,也使得某一区域的非计划维护不会对其他区域造成影响。
Tier IV数据中心的可用性需要达到99.995%,甚至更高,服务中断只有在计划中的预防性演习或者非计划的灾难应急停电的情况下才会发生,每年的中断时间不超过10分钟。

  1. 数据中心分级标准
    数据中心的分级秉承“就低原则”,举个例子,一个数据中心的基础设施除通信系统外其他部分的级别均为Tier IV级,但是通信系统只有Tier II级,那么这个数据中心级别只有Tier II。

还存在另外一种状况,我们知道数据中心存储的数据不尽相同,并非每一个字节的数据都需要99.995%的高可用性,例如文件共享、视频监控、培训资料等非结构化数据对可用性级别要求远远弱于业务数据,因此数据中心会采用多层级混合设计以降低运营成本,这时就需要对数据中心所有层级进行评估,估算计算数据中心的Tier I~Tier IV各层所占据的比例,进而判断其分级级别。
我国也对数据中心的级别进行了定义,根据国家规范《电子计算机机房设计规范》(GB50174—1993)将数据中心划分为A(容错型)、B(冗余型)、C( 基本型),在数据中心选址、区域结构、环境管理等方面进行了明确区分。

相关文章
|
存储 运维 安全
AIGC时代数据中心运维面临的挑战
AIGC时代数据中心运维面临的挑战
446 1
AIGC时代数据中心运维面临的挑战
|
11月前
|
弹性计算 监控 安全
助力企业高效构建安全、可观测的云上数据中心
本次课程聚焦于助力企业高效构建安全、可观测的云上数据中心,涵盖三大方面:1) 数据中心网络面临的挑战,包括VPC、NAT网关和私网连接等产品的功能与挑战;2) 数据中心网络产品重磅发布,涉及安全设计建议、容灾能力提升及深度可观测能力的增强;3) 用户体验升级,通过VPC IPAM实现高效的网络地址管理和简化的产品体验。整体旨在为企业提供更安全、稳定、高效的云上解决方案。
|
12月前
|
运维 监控 持续交付
自动化运维在现代数据中心的应用与实践####
本文探讨了自动化运维技术在现代数据中心中的应用现状与实践案例,分析了其如何提升运维效率、降低成本并增强系统稳定性。通过具体实例,展示了自动化工具如Ansible、Puppet及Docker在环境配置、软件部署、故障恢复等方面的实际应用效果,为读者提供了一套可参考的实施框架。 ####
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术如何革新现代数据中心的运维管理,通过集成人工智能、大数据分析及自动化工具,显著提升系统稳定性、效率和响应速度。文章首先概述了AIOps的核心概念与技术框架,随后详细分析了其在故障预测、异常检测、容量规划及事件响应等方面的应用实例,最后探讨了实施过程中面临的数据质量、技能匹配及安全性等挑战,并提出了相应的应对策略。本研究旨在为数据中心管理者提供关于采纳和优化AIOps实践的洞见,以期推动行业向更高效、智能的运维模式转型。 ####
|
12月前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
268 1
|
安全 网络协议 Linux
Linux系统管理、服务器设置、安全、云数据中心
Linux系统管理、服务器设置、安全、云数据中心
|
人工智能 运维 监控
智能运维在现代数据中心的应用与挑战
随着云计算和大数据技术的迅猛发展,现代数据中心的运维管理面临着前所未有的挑战。本文探讨了智能运维技术在数据中心中的应用,包括自动化监控、故障预测与诊断、资源优化等方面,并分析了当前面临的主要挑战,如数据安全、系统集成复杂性等。通过实际案例分析,展示了智能运维如何帮助数据中心提高效率、降低成本,并提出了未来发展趋势和建议。
|
机器学习/深度学习 运维 数据挖掘
智能化运维:利用机器学习优化数据中心
【6月更文挑战第28天】本文将探讨如何通过机器学习技术来优化数据中心的运维工作。我们将首先介绍机器学习的基本原理,然后详细讨论其在数据中心运维中的应用,包括故障预测、性能优化和自动化运维等。最后,我们将通过一个实际案例来展示机器学习在数据中心运维中的实际效果。
|
机器学习/深度学习 存储 人工智能
智能化运维:未来数据中心的守护者
【6月更文挑战第13天】随着技术的飞速发展,传统的运维模式已难以满足现代数据中心的需求。本文将探讨智能化运维的概念、优势以及如何通过AI和机器学习技术提升数据中心的管理效率和安全性。
|
机器学习/深度学习 运维 监控
智能化运维:未来数据中心的守护者
【6月更文挑战第8天】本文探讨了智能化运维在现代数据中心的重要性与应用,分析了其如何通过自动化和机器学习技术提升效率、降低成本并增强系统的稳定性。文章将详细介绍智能化运维的关键组件,包括自动化工具、监控软件以及故障预测机制,并通过案例分析展示这些技术在实际环境中的应用效果。
281 5

热门文章

最新文章