三个步骤改造出一个有弹性的混合数据中心!

简介:

获得数据中心级别的弹性是许多企业的一个共同目标。这让企业得以在需要时,可以向上扩展(增加)、向下扩展(减少)或向外扩展资源,而不是一下子承担资本支出的全部负担。对我们IT专业人员来说,问题在于如何高效、有效地管理软件定义资源具有的弹性,同时帮助确保服务交付没有因资源饱和和错误事件而出现降级。

我称之为“IT OAR”,这代表为了借助整个生命周期来驾驭混合数据中心而需要采取的行动。“O”代表优化,用户可以在资源方面获得更高的效率。“A”代表自动化,你在整合和交付的服务方面提供更大的规模。“R”则代表报告优化和自动化这些行动的效率和效果。如果结合这三者,你就有办法畅游数字化转型时代,并且消除它给IT运营所带来的负担。

那么,如何才能最大限度地利用IT OAR?不妨逐一解析优化、自动化和报告,帮助确保数据中心实现成功的服务整合和交付。

数据中心

  优化

虚拟数据中心方面的优化涵盖虚拟数据中心运行状况,涉及资源的利用率和饱和,同时涵盖资源容量规划和资源弹性。一个关键的问题是:在虚拟数据中心,什么资源需要加以优化?

类似其他IT学科领域,虚拟环境的优化同样归结为优化资源(即少花钱多办事)。这常常导致过量分配资源,带来资源饱和状态,最终导致不可避免的争夺问题。如果争夺现象长时间存在,或者太过快速地出现,错误通常就会出现。

资源优化始于调整计算(vCPU)、内存(vRAM)、网络和存储等资源。它可扩展到应用程序和可调整的属性,并通过虚拟机管理程序,可以进一步扩展到主机和集群。

vCPU和vRAM方面的开销体现在饱和和错误中,因而导致应用程序性能低下和故障单。过高配置和过低配置虚拟机肯定会有成本。优化力求找到整个虚拟数据中心方面的细节。

为了优化计算资源,要着眼于vCPU利用率、计数器以及处理器队列长度。比如说,就VMware而言,要关注的CPU计数器有:%USED、%RDY和%CSTP。%USED显示了虚拟机在物理CPU上面执行CPU周期上花了多少时间。%RDY定义了虚拟机想要执行,但又不得不等待由虚拟机内核(VMKernel)来调度的时间百分比。%CSTP是指SMP虚拟机准备运行,但是由于co-vCPU调度争夺而引起延迟的时间百分比。微软里面的性能计算器有SystemProcessor Queue Length、Process% Processor Time、Processor%Processor Time和Thread% Processor Time。

为了优化内存,要着眼于内存交换和访客级分页。就VMware而言,计数器是SWP/s和SWW/s;就微软而言,计数器是pages/s。如果是Linux虚拟机,充分利用vmstat和swap counters si等,分别负责换入和换出。

当然,虚拟化高手在优化过程中,还需要将虚拟机管理程序内核的优化/回收方法以及虚拟数据中心基础设施的应用程序堆栈和布局考虑进来。

自动化

虚拟数据中心里面的自动化涵盖工作流程。这些工作流程可能包括管理行动,比如配置或收回虚拟资源、以一对多的方式设置配置文件(profile)和配置,并且面对整个虚拟数据中心,以一致、可扩展的方式深思策略方面的最佳实践。

脚本、模板和蓝图体现了IT自动化。它们是用你的最佳实践方法创建的――久经考验的IT方法和流程。遗憾的是,自动化本身无法区别好坏。因此,使坏的IT实践实现自动化会在你的虚拟数据中心导致大规模的难以置信的麻烦。

为了防止这种情况出现,要确保自动化简单。首先,在有控制的规模下实现自动化,为此遵循这个准则“别破坏用户的生产数据中心环境。”下一步,从头到尾监控整个自动化过程,确保每一步都按预期的要求来执行。最后,分析结果,针对发现的情况做出必要的调整,从而优化自动化过程。

一开始就要想着最终目标,问问自己:自动化工作要解决什么问题?如果你回答不了这个问题,那么这表明你还没有准备好使任何解决办法实现自动化。

报告

虚拟数据中心里面的报告细述了你在虚拟数据中心的整个历程。这个简单的历程不该过于复杂化。故事始于虚拟数据中心和关键绩效指标方面的细节。然后逐渐深入到如何实现增强虚拟数据中心交付能力所需的目标。由于敏捷性、可用性和扩展性是虚拟数据中心的核心,报告证明了优化和自动化取得的成果。什么跟想着最终目标来得一样重要?答案就是受众和上下文。报告最终寻求的是需要做出的决定。不多也不少。

所有的OAR行动相互关联。没有优化的自动化会导致工作毫无目的地重复。没有报告的优化和自动化会导致做得很对的工作得不到赞扬,也无法告知决策者要采取什么样的合适行动。你在OAR方面做得越好,数据中心转型之旅对你和贵公司来说就会越顺坦。

原文标题:Managing The Hybrid Data Center

作者:Kong Yang


本文转自d1net(转载)

相关文章
|
机器学习/深度学习 存储 人工智能
|
运维 安全 测试技术