由于云计算和虚拟化等新技术的出现,数据中心的演变可能将其转变为一个非常不同的环境。然而,任何数据中心都需要某些基本要素才能顺利和成功地运作。无论您企业的数据中心是步入式机柜(walk-in closet)还是飞机式机架(airplane hanger),或者甚至是在浮式驳船上(有传言称Google正在构建),这些要素都是适用的:
1、环境控制
标准化和可预测的环境是任何高质量运营的数据中心的基石。其不仅仅是保持数据中心操作环境的冷却和适当的湿度水平(根据维基百科,推荐的数据中心操作环境温度范围是61-75华氏度/ 16-24摄氏度和40-55%的湿度)。您企业还必须考虑防火、气流和功率分配。我曾经供职过的一家公司对于这几点的对待就非常严肃,确保他们的数据中心尽可能保持原始,规定纸板箱严禁存放在操作机房。这背后的理论是,由于分配机制,将更冷的空气带到机架的前面,这会使得纸板的颗粒可能进入气流,并有可能潜在的污染服务器。这可能是有些极端了,但肯定说明了这个概念的重要性。
2、安全
毫无疑问(但无论如何,我还是会强调)物理安全是可靠的数据中心的基础。使系统保持锁定和密钥,并仅仅只向授权人员提供密钥,且只允许通过网络对服务器、应用程序和数据进行必要的访问。可以肯定地说,对于任何公司而言(当然,除了人之外),最宝贵的资产都是驻留在数据中心的。小偷们将会目标瞄准笔记本电脑或个人手机。而专业的黑客大盗则瞄准的是数据中心。门锁是可以撬开的,所以我建议采用警报等装置。当然,警报也是可能被黑客攻破的,所以您企业还可以考虑采用下一措施:锁定服务器机架、为您数据中心的安全系统备份电源、招聘保安员。这措施都取决于您企业数据中心的具体安全需求,但请记住,“安全的确保仅仅只是一个过程,而不是目的地。”
3、责任
站在系统管理员的立场,我可以证明绝大多数IT人员都是专业和值得信赖的。然而,这并不否定在数据中心内需要对于操作人员及与他们交互的相关人员进行责任的追踪。数据中心应通过胸牌徽章访问(badge access)来记录进出工作人员的详细日志信息(我建议这些日志由IT以外的人员,例如安全部门管理,或者信息副本由IT主管和副总裁共同掌握)。访客在任何时候都应该详细登记进出细节并继续受到监督。应打开网络/应用程序/文件资源的审计。最后一点,但并非不重要的一点是,每款系统都应该有一个明确可识别的所有者,无论其是服务器、路由器、数据中心冷却器还是报警系统。
4、管理策略
数据中心所涉及的每个过程背后都应该有一套相应的政策,以帮助保持和管理环境。您企业数据中心需要有相关的系统访问和使用的管理策略(例如,只有数据库管理员才能完全控制SQL服务器)。您企业还应该有数据保留策略:诸如数据应该存储备份多长时间?你企业是否将这些数据保留在场外异地,如果是这样的话,什么时候到期?相同的理念也适用于安装新的系统,检查过时的设备/服务,以及删除报废旧设备(例如,擦除服务器硬盘驱动器以及捐赠或回收硬件)。
5、冗余
我曾经拥有的第一辆车是一辆蓝色的福特Pinto。我的父母为其支付了400美元,当时的油钱是每加仑一美元,所以,我到处都开着这辆车。其有一个备用轮胎经常派上用场。我想强调的要点是:即使我的老汽车容易发生故障,但其有冗余。您的数据中心可能成本造价更昂贵,更关键,因此您需要的绝不仅仅是一个“备胎”以确保其保持健康。您企业业务所需的所有东西您都将需要预留至少两项,无论其是邮件服务器、ISP、数据光纤链路或IP语音(VOIP)电话系统虚拟机。在许多情况下,预留三个或更多也不会有损害!
重要的不仅仅是冗余组件,而且,测试和确保它们可靠工作的过程也是极其重要的,例如按计划的故障转移训练和研究新的方法。
6、监测
监控所有系统,以确保正常运行和健康运营状况将带来巨大的积极价值,但这仅仅只是开始。您企业数据中心还需要监控正在使用的带宽,以及能量、存储、物理机架空间以及您的数据中心所提供的任何其他“商品”。
有相应免费的工具,如Nagios可用于螺母和螺栓监控;以及更复杂的解决方案,如Dranetz可进行功率测量。在出现停机或低阈值时发出警报是该过程的一部分,并确保为警报安排故障保护,以使它们独立于数据中心(例如,如果您企业的电子邮件服务器是在已经一台死机的VMWare ESX主机上,那么另一款系统应该对其进行监视,并能够发出通知)。
7、可扩展性
今天,您的公司或许需要25台服务器来完成一系列任务,包括虚拟化、冗余、文件服务、电子邮件、数据库和分析。那么,下个月将需要多少呢,明年呢或者下一个十年需要什么呢?确保您企业拥有适当规模的数据中心,具有足够的扩展容量,以增加功率、网络、物理空间和存储。如果您的企业是持续盈利的,那么我可以保证您企业的数据中心需求将会增长,那么现在就是开始规划的时候了。
规划可扩展性不是一劳永逸的,相反,这是一个持续的过程。明智的企业将积极跟踪和报告这一概念。我们可以从这些报告中看到“下一个目标”,其标识了必须尽可能快地满足可扩展性的关键区域(例如,缺少物理机架空间)。
8、变更管理
您可能会认为变更管理是属于数据中心“管理策略”的一部分,这一考虑具有一定的意义。然而,我认为,这既是一种政策,也是一种哲学。适当的变更管理准则有助于确保您的数据中心没有发生任何未经计划、未提前安排讨论或同意的事情,并提供了退出步骤或一套“B”计划备案。无论是将新系统引入企业还是报废旧系统,数据中心的所有要素的使用寿命周期都必须根据您的变更管理规划蓝图进行。
9、组织
我还从来没遇到过一个IT专业人士不认为时间短促的。dan ge新系统的推出时,可能会导致一些零碎角落事务由于时间仓促的恐慌超过了截止日期而未被处理,而这些零碎事情似乎总是包括使操作环境保存良好的整洁。
一项成功的系统部署不仅意味着插入并能够启动;其还包括通过标准化和可支持的方法将设备集成到数据中心。您的服务器机架应该是干净的,并以逻辑方式布置(生产系统在一个机架,测试系统在另一个)。你的电缆应该是适当的长度,并严格遵循布线指南,而不是随意的。下面两幅数据中心布线图中,你认为哪种情况更有助于问题的解决和提供支持呢:
资料来源:维基共享资源
或是这种:
10、文档
最后一项关键要素是适当的、有用的、及时的文档纪录——如果你企业数据中心不遵守这一严格的程序,这将会是另一项能够很容易地让您在数据中心操作运营过程中出现难题的关键要素。仅仅将你数据中心的交换机布局图和哪台服务器插在哪里制定一份文档纪录是远远不够的;您数据中心的变更管理指南应该强制文档保持相关性,并随着细节的变化向所有相关的人员提供,而且必须始终如此。
十大要素要整合
上述这些概念的伟大之处在于它们完全是硬件/软件无关的。无论您企业的数据中心同时包含了Linux,Windows或其他操作系统的服务器的运行,还是仅仅是网络交换机和大型机的集合,希望这些关键要素的提点将对您和您的企业有用。
为了将它们整合在一起,将IT环境视为一个轮子,以数据中心为中心,那么这十大关键概念要素将作为周围的“轮胎”,如下图所示:
为每个组件都投入时间和能量将确保您企业“轮子”的顺利运转。毕竟,这是你企业数据中心最为核心的目标,对吧?
关于作者
本文作者Scott Matteson是一名高级系统管理员和自由撰稿人,他也为小型企业组织提供咨询服务。
本文转自d1net(转载)