高效数据中心的10大关键要素

简介:

由于云计算和虚拟化等新技术的出现,数据中心的演变可能将其转变为一个非常不同的环境。然而,任何数据中心都需要某些基本要素才能顺利和成功地运作。无论您企业的数据中心是步入式机柜(walk-in closet)还是飞机式机架(airplane hanger),或者甚至是在浮式驳船上(有传言称Google正在构建),这些要素都是适用的:

1、环境控制

标准化和可预测的环境是任何高质量运营的数据中心的基石。其不仅仅是保持数据中心操作环境的冷却和适当的湿度水平(根据维基百科,推荐的数据中心操作环境温度范围是61-75华氏度/ 16-24摄氏度和40-55%的湿度)。您企业还必须考虑防火、气流和功率分配。我曾经供职过的一家公司对于这几点的对待就非常严肃,确保他们的数据中心尽可能保持原始,规定纸板箱严禁存放在操作机房。这背后的理论是,由于分配机制,将更冷的空气带到机架的前面,这会使得纸板的颗粒可能进入气流,并有可能潜在的污染服务器。这可能是有些极端了,但肯定说明了这个概念的重要性。

2、安全

毫无疑问(但无论如何,我还是会强调)物理安全是可靠的数据中心的基础。使系统保持锁定和密钥,并仅仅只向授权人员提供密钥,且只允许通过网络对服务器、应用程序和数据进行必要的访问。可以肯定地说,对于任何公司而言(当然,除了人之外),最宝贵的资产都是驻留在数据中心的。小偷们将会目标瞄准笔记本电脑或个人手机。而专业的黑客大盗则瞄准的是数据中心。门锁是可以撬开的,所以我建议采用警报等装置。当然,警报也是可能被黑客攻破的,所以您企业还可以考虑采用下一措施:锁定服务器机架、为您数据中心的安全系统备份电源、招聘保安员。这措施都取决于您企业数据中心的具体安全需求,但请记住,“安全的确保仅仅只是一个过程,而不是目的地。”

3、责任

站在系统管理员的立场,我可以证明绝大多数IT人员都是专业和值得信赖的。然而,这并不否定在数据中心内需要对于操作人员及与他们交互的相关人员进行责任的追踪。数据中心应通过胸牌徽章访问(badge access)来记录进出工作人员的详细日志信息(我建议这些日志由IT以外的人员,例如安全部门管理,或者信息副本由IT主管和副总裁共同掌握)。访客在任何时候都应该详细登记进出细节并继续受到监督。应打开网络/应用程序/文件资源的审计。最后一点,但并非不重要的一点是,每款系统都应该有一个明确可识别的所有者,无论其是服务器、路由器、数据中心冷却器还是报警系统。

4、管理策略

数据中心所涉及的每个过程背后都应该有一套相应的政策,以帮助保持和管理环境。您企业数据中心需要有相关的系统访问和使用的管理策略(例如,只有数据库管理员才能完全控制SQL服务器)。您企业还应该有数据保留策略:诸如数据应该存储备份多长时间?你企业是否将这些数据保留在场外异地,如果是这样的话,什么时候到期?相同的理念也适用于安装新的系统,检查过时的设备/服务,以及删除报废旧设备(例如,擦除服务器硬盘驱动器以及捐赠或回收硬件)。

5、冗余

我曾经拥有的第一辆车是一辆蓝色的福特Pinto。我的父母为其支付了400美元,当时的油钱是每加仑一美元,所以,我到处都开着这辆车。其有一个备用轮胎经常派上用场。我想强调的要点是:即使我的老汽车容易发生故障,但其有冗余。您的数据中心可能成本造价更昂贵,更关键,因此您需要的绝不仅仅是一个“备胎”以确保其保持健康。您企业业务所需的所有东西您都将需要预留至少两项,无论其是邮件服务器、ISP、数据光纤链路或IP语音(VOIP)电话系统虚拟机。在许多情况下,预留三个或更多也不会有损害!

重要的不仅仅是冗余组件,而且,测试和确保它们可靠工作的过程也是极其重要的,例如按计划的故障转移训练和研究新的方法。

6、监测

监控所有系统,以确保正常运行和健康运营状况将带来巨大的积极价值,但这仅仅只是开始。您企业数据中心还需要监控正在使用的带宽,以及能量、存储、物理机架空间以及您的数据中心所提供的任何其他“商品”。

有相应免费的工具,如Nagios可用于螺母和螺栓监控;以及更复杂的解决方案,如Dranetz可进行功率测量。在出现停机或低阈值时发出警报是该过程的一部分,并确保为警报安排故障保护,以使它们独立于数据中心(例如,如果您企业的电子邮件服务器是在已经一台死机的VMWare ESX主机上,那么另一款系统应该对其进行监视,并能够发出通知)。

7、可扩展性

今天,您的公司或许需要25台服务器来完成一系列任务,包括虚拟化、冗余、文件服务、电子邮件、数据库和分析。那么,下个月将需要多少呢,明年呢或者下一个十年需要什么呢?确保您企业拥有适当规模的数据中心,具有足够的扩展容量,以增加功率、网络、物理空间和存储。如果您的企业是持续盈利的,那么我可以保证您企业的数据中心需求将会增长,那么现在就是开始规划的时候了。

规划可扩展性不是一劳永逸的,相反,这是一个持续的过程。明智的企业将积极跟踪和报告这一概念。我们可以从这些报告中看到“下一个目标”,其标识了必须尽可能快地满足可扩展性的关键区域(例如,缺少物理机架空间)。

8、变更管理

您可能会认为变更管理是属于数据中心“管理策略”的一部分,这一考虑具有一定的意义。然而,我认为,这既是一种政策,也是一种哲学。适当的变更管理准则有助于确保您的数据中心没有发生任何未经计划、未提前安排讨论或同意的事情,并提供了退出步骤或一套“B”计划备案。无论是将新系统引入企业还是报废旧系统,数据中心的所有要素的使用寿命周期都必须根据您的变更管理规划蓝图进行。

9、组织

我还从来没遇到过一个IT专业人士不认为时间短促的。dan ge新系统的推出时,可能会导致一些零碎角落事务由于时间仓促的恐慌超过了截止日期而未被处理,而这些零碎事情似乎总是包括使操作环境保存良好的整洁。

一项成功的系统部署不仅意味着插入并能够启动;其还包括通过标准化和可支持的方法将设备集成到数据中心。您的服务器机架应该是干净的,并以逻辑方式布置(生产系统在一个机架,测试系统在另一个)。你的电缆应该是适当的长度,并严格遵循布线指南,而不是随意的。下面两幅数据中心布线图中,你认为哪种情况更有助于问题的解决和提供支持呢:

  资料来源:维基共享资源

或是这种:

  10、文档

最后一项关键要素是适当的、有用的、及时的文档纪录——如果你企业数据中心不遵守这一严格的程序,这将会是另一项能够很容易地让您在数据中心操作运营过程中出现难题的关键要素。仅仅将你数据中心的交换机布局图和哪台服务器插在哪里制定一份文档纪录是远远不够的;您数据中心的变更管理指南应该强制文档保持相关性,并随着细节的变化向所有相关的人员提供,而且必须始终如此。

十大要素要整合

上述这些概念的伟大之处在于它们完全是硬件/软件无关的。无论您企业的数据中心同时包含了Linux,Windows或其他操作系统的服务器的运行,还是仅仅是网络交换机和大型机的集合,希望这些关键要素的提点将对您和您的企业有用。

为了将它们整合在一起,将IT环境视为一个轮子,以数据中心为中心,那么这十大关键概念要素将作为周围的“轮胎”,如下图所示:

为每个组件都投入时间和能量将确保您企业“轮子”的顺利运转。毕竟,这是你企业数据中心最为核心的目标,对吧?

关于作者

本文作者Scott Matteson是一名高级系统管理员和自由撰稿人,他也为小型企业组织提供咨询服务。


 


  

本文转自d1net(转载)


 

目录
相关文章
|
7月前
|
存储 传感器 监控
探索现代数据中心的冷却技术革新
【4月更文挑战第23天】 在信息技术迅猛发展的今天,数据中心作为计算和存储的核心枢纽,其稳定性和效率至关重要。然而,随着处理能力的增强,设备发热量急剧上升,有效的冷却方案成为确保数据中心持续运行的关键因素。本文将深入分析当前数据中心面临的热管理挑战,并探讨几种前沿的冷却技术,包括液冷系统、热管技术和环境自适应控制策略。通过比较不同技术的优缺点,我们旨在为数据中心管理者提供实用的冷却解决方案参考。
|
4月前
|
机器学习/深度学习 存储 监控
利用机器学习技术优化数据中心能效
【7月更文挑战第36天】在数据中心管理和运营中,能源效率已成为关键性能指标之一。随着能源成本的不断上升以及环境保护意识的增强,开发智能化、自动化的解决方案以降低能耗和提高能源利用率变得尤为重要。本文探讨了如何应用机器学习技术对数据中心的能源消耗进行建模、预测和优化,提出了一个基于机器学习的框架来动态调整资源分配和工作负载管理,以达到节能的目的。通过实验验证,该框架能够有效减少数据中心的能耗,同时保持服务质量。
|
7月前
|
存储 大数据 数据处理
探索现代数据中心的冷却技术
【5月更文挑战第25天】 在信息技术迅猛发展的今天,数据中心作为其核心基础设施之一,承载了巨大的数据处理需求。随着服务器密度的增加和计算能力的提升,数据中心的能耗问题尤其是冷却系统的能效问题日益凸显。本文将深入探讨现代数据中心所采用的高效冷却技术,包括液冷解决方案、热管技术和环境自适应控制等,旨在为数据中心的绿色节能提供参考和启示。
|
7月前
|
人工智能 监控 物联网
探索现代数据中心的冷却技术
【5月更文挑战第27天】 在信息技术迅猛发展的今天,数据中心作为信息处理的核心设施,其稳定性和效率至关重要。而随着计算能力的提升,数据中心面临的一个重大挑战便是散热问题。本文将深入探讨现代数据中心冷却技术的进展,包括传统的空气冷却系统、水冷系统,以及新兴的相变材料和热管技术。通过对不同冷却方式的效率、成本及实施难度的分析,旨在为读者提供一份关于数据中心散热优化的参考指南。
|
7月前
|
机器学习/深度学习 资源调度 监控
利用机器学习技术优化数据中心能效
【5月更文挑战第30天】在数据中心管理和运营中,能源效率的优化是降低运营成本和减少环境影响的关键。本文旨在探讨如何应用机器学习技术来提升数据中心的能源效率。通过对现有数据中心运行数据的深入分析,开发预测性维护模型,以及实施智能资源调度策略,我们可以显著提高数据中心的能效。本研究提出了一种集成机器学习算法的框架,该框架能够实时监控并调整数据中心的能源消耗,确保以最佳性能运行。
|
7月前
|
存储 大数据 数据中心
提升数据中心能效的先进冷却技术
【5月更文挑战第27天】 在信息技术不断进步的今天,数据中心作为计算和存储的核心枢纽,其能源效率已成为评价其可持续性的关键指标。本文将探讨当前数据中心面临的热管理挑战,并展示一系列创新的冷却技术解决方案,旨在提高数据中心的能效,同时确保系统的稳定性和可靠性。通过对比传统冷却方法和新兴技术,我们将分析各种方案的优势、局限性以及实施难度,为数据中心运营者提供科学的决策参考。
|
7月前
|
存储 传感器 人工智能
探索现代数据中心的冷却技术革新
【5月更文挑战第18天】 在数字化时代,数据中心作为信息处理与存储的核心设施,其稳定性和效能至关重要。随着计算需求的激增,数据中心的冷却系统面临着前所未有的挑战。传统的空调冷却方法不仅耗能巨大,而且效率低下。本文将深入探讨现代数据中心冷却技术的最新进展,包括液冷技术、热管应用、环境辅助设计以及智能化管理等方面,旨在提供一种高效、可持续且经济的解决方案,以应对日益增长的冷却需求。
|
6月前
|
移动开发 监控 前端开发
基于 HTML5 WebGL 和 VR 技术的 3D 机房数据中心可视化
基于 HTML5 WebGL 和 VR 技术的 3D 机房数据中心可视化