vShpere可用性之五HA安装及配置

简介:

第五章 HA安装及配置

在前面四章节中,不但讲述了如何准备适合虚拟化的硬件、软件,以及如何使用现有的硬件、软件搭建一套实验环境,还讲述了通过vCenter Server如何添加主机和ISCSI存储。

这三章节是实现VMware HA所不可少的。它构成了整个实验的很重要的第一步,同时也循序渐进的提供了创建VMwareHA的渐进步骤,如果你在看本章节前,你仍没有阅读以上三篇内容,建议您返回去阅读。

在本章节中,不但会讲述HA与VMwareHA的概念,也会讲述通过vCenter Server如何创建VMwareHA。(也会提及VMotion的创建)

一、高用性(HA)与VMwareHA的理解

1、HA(高可用性)群集

高可用性(HA)集群是群集的一种,平日较常见的为MSCS(微软群集服务),如SQL的故障转移群集。

高可用性群集,一般有两个或两个以上的节点,且分为活动节点及备用节点。通常把正在执行业务的称为活动节点,而作为活动节点的一个备份的则称为备用节点。当活动节点出现问题,导致正在运行的业务(任务)不能正常运行时,备用节点此时就会侦测到,并立即接续活动节点来执行业务。从而实现业务的不中断或短暂中断(对客户端来说,基本上感觉不到故障的存在)。

高可用性群集的实现是基于资源切换来进行的。这些资源包括节点的IP地址、主机名(NetBios名称)、磁盘卷、应用程序等。而资源的监控和接续,是依靠HA软件来实现的如MSCS等,这些软件用来通过“心跳信号”监控群集中对方节点的运行状态,一旦发现对方存在了故障,就会强制将所有的资源据为已有并继续对外提供服务。

而VMwareHA也是高可用性的一种应用。VMware HA 与传统的群集和高可用性解决方案都支持主机发生故障时的自动恢复。它们是互为补充的,但是在软硬件要求、恢复时间及应用程序和操作系统的识别程度等方面有所不同。

2、VMware HA的工作方式、首先及辅助主机

VMware HA 可以将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,如果发生故障,故障主机上的虚拟机将在备用主机上重新启动。

在将主机添加到 VMware HA 群集时,代理将上载到主机,并配置为与群集内的其他代理通信。添加到群集的前五台主机将指定为首选主机,随后的所有主机将指定为辅助主机。首选主机维护和复制所有群集状况,并用于启动故障切换操作。如果从群集内移除某台首选主机,则 VMware HA 会将另一台主机提升为首选状态。

加入群集的任何主机必须与现有首选主机通信以完成其配置(当您正在将第一台主机添加到群集时除外)。必须至少有一台首选主机运行正常,以便 VMware HA 正确进行操作。如果所有首选主机均不可用(不响应),则无法为 VMware HA 成功配置任何主机。

其中一台首选主机还将指定为活动首选主机,其职责包括:

l 决定在何处重新启动虚拟机。

l 跟踪失败的重新启动尝试。

l 确定尝试重新启动虚拟机的适当时间。

如果活动首选主机发生故障,则另一台首选主机会将其替换。

3、结合使用 VMware HA 和 DRS

通过VMware HA 和 Distributed Resource Scheduler (DRS) 相结合,可将自动故障切换与负载平衡结合起来。这种结合可在 VMware HA 将虚拟机移至其他主机后更快再平衡虚拟机。

VMware HA 执行故障切换并在其他主机上重新启动虚拟机时,首要任务就是使所有的虚拟机立即可用。重新启动虚拟机后,启动这些虚拟机的主机可能会负载过重,而其他主机则相对负载较轻。VMware HA 将使用 CPU和内存预留来确定故障切换,而实际使用情况可能会更高。

在结合使用 DRS 和 VMware HA 并且启用了接入控制的群集内,可能不会从正在进入维护模式的主机上撤出虚拟机。这是由于预留用于维护故障切换级别的资源造成的。必须使用 VMotion 将虚拟机手动迁出主机。

当禁用了 VMware HA 接入控制时,故障切换资源限制将不会传递到 DRS 和 VMware 分布式电源管理 (DPM)。也不会强制执行限制条件。

l DRS 会从主机撤出虚拟机,并将主机置于维护模式或待机模式,而不考虑这样做可能对故障切换要求造成影响。

l VMware DPM 会关闭主机(将其置于待机模式),即使这样做会违反故障切换要求。

4、VMwareHA、DRS、VMotion相互关系

VMware VMotion是能够将虚拟机动态地在不同的物理主机(ESX主机)之间迁移的技术,且在迁移的过程是不会终止最终用户的访问。

VMware HA利用了vmotion技术,能够在虚拟机失效,或是ESX主机发生错误时,实时地迁移至还存活的ESX主机上继续执行。

VMware DRS将VMotion及HA技术融合在一起,根据ESX主机的CPU或内存资源负载,动态地迁移虚拟机至较负载较轻的ESX主机上,期间可以利用DRS建议,把一台ESX主机的上多个虚拟机放置在不同ESX主机上。(虚拟机放置,简单的说就是会为当前虚拟机选择较为适合此存放的ESX主机的过程,一般会依据CPU负载、内存多少、I/O读写、网络负载四个方面来衡量,并有星级评价,越好星级越高)

5、VMwareHA的工作原理和功能

A、工作原理是什么

VMware HA 不间断地监控群集中所有的 ESX Server 主机,并检测故障。放置在每台主机上的代理程序不断向群集中的其他主机发出“心跳信号”,“心跳信号”的终止将启动所有受影响的虚拟机在其他主机上的重启过程。

HA 时刻监控群集中是否有足够的资源可用,以便在主机发生故障时能够在其他物理主机上重启虚拟机。利用 ESX Server 存储堆栈中的锁定技术,可以使虚拟机的安全重启成为可能,它允许多个 ESX Server 同时访问同一虚拟机文件。

B、VMware HA 的功能

当 ESX Server 主机发生硬件故障时,将为故障切换容量范围内所有正在运行的虚拟机提供自动故障切换(请参见下面的指定故障切换容量)。可以在无需任何人员干预的情况下自动检测服务器故障和重启虚拟机。

VMware HA 利用 DRS 在故障切换后提供动态的、智能的资源分配和虚拟机优化。主机发生故障并且虚拟机已在其他主机上重启后, DRS 可以提供进一步的迁移建议,或者迁移虚拟机以获得更优化的主机放置和平衡的资源分配。

VMware HA 支持易于使用的配置和使用 VirtualCenter 进行监控。HA 确保该容量总是可用的(在指定的故障切换容量限制内),以便重启所有受服务器故障影响的虚拟机(基于为虚拟机配置的资源预留)。

不间断地监控容量利用率,并“预留”备用容量以便能够重启虚拟机。当未发生故障时,虚拟机可以完全利用备用故障切换容量。

6、VMwareHA实验过程中的心得

A、HA是针对安装有ESX主机的硬件的,在ESX主机故障后,虚拟机在其它主机恢复时使用了VMotion技术。但VMotion则是针对虚拟机的。(参考4、VMwareHA、DRS、VMotion相互关系)

B、HA实现过程也就是虚拟机故障恢后在其它主机的过程中,虚拟机对外的服务会中断,但是时间相对较短罢了。这和VMotion上也有不同之处。

C、所有的虚拟机硬盘文件等必需要放在共享存储上。

D、需要使用到DNS或HOSTS服务。

E、ESX主机在同一子网内,如果有多个网段,要确保ESX主机上有足够的网卡去连接。

F、保证虚拟机交换机的一致性,网络构架的一致性,管理和ISCSI的为一组ports,而虚拟机的为一组ports。

二、通过vCenter Server控制台创建HA

在创建HA的动作开始之前,请一定核查下DNS或HOSTS的设置情况,也就是当你在ESX主机及VC Server之前互相PINGNETBIOS名称时,可以解析到。如果不成功,请参考前三篇文章查看原因。

Step1、在vCenter Server的控制台创建一个选项。这个选项位于树形结构的数据中心下面。使用vSphere Client连接到vCenter Server,在左侧的“主机和群集”树形结构中,选定数据中心“IT168“,并右键单击,选择“新建群集“。

clip_image002

Step2、会弹出“新建群集向导”界面,在“群集功能”页,这让你选择用于此群集的一些功能,主要是两个“VMware HA”和“VMware DRS”,这两者的关系及各自介绍在本篇前文中有提及,请前往参考,或是仔细阅读理解下面部分的文字说明。选择好后,“下一步”

clip_image004

Step3、由于上一步的操作中选择了“VMware DRS”,在“VMware DRS”页,需要选择自动化的级别。在VC中VMware提供了“虚拟机放置”的功能,会依据CPU负载、内存多少、I/O读写、网络负载四个方面进行衡量后,将虚拟机转移到最适合其存放的ESX主机上。值得注意的是:“虚拟机放置”是一个过程,先对ESX主机进行资源的判断,然后再进行虚拟机与其的配对,最终到转移ESX主机上的过程。此处选择“全自动”,也就是将虚拟机启动后自动置于主机上,且这个过程中有“配对”的动作。“下一步”

clip_image006

Step4、在“电源管理”界面,提供了群集指定默认的电源管理选项,通过图示可以看到每项的动作意味着什么,此处保留默认。“下一步”。

clip_image008

Step5、在“VMware HA”界面,提供了一些群集设置的选项,请根据实际情况选择,在此实验场景中,由于只有两台ESX主机,故选择了下面的一些设置。“下一步”

clip_image010

Step6、在“虚拟机选项”界面,设定HA对虚拟机重新启动的优先级,而主机隔离响应的选项相比着VI3中,是新增加的,也是采取PING网关后ESX主机采取的对其上虚拟机的动作。“下一步”

clip_image012

Step7、在“虚拟机监控”界面,启用虚拟机监控,并设置敏感度为高。“下一步”

clip_image014

Step8、在“VMware EVC”界面,保留默认设置。“下一步”

clip_image016

Step9、在“虚拟机交换文件位置”页,选择“将交换文件存储在与虚拟机相同的目录中”。“下一步”

clip_image018

Step10、完成上述设置后的概览,呵呵,如果后悔或是需要调整,在这一页出现时还来的及回退。确定完成。

clip_image020

Step11、此时,就完成了群集的建立,大体框架建成了,但内容还需要填充的,接下来就是把之前新添加的ESX主机给添加到群集下面(树形结构中,为HA&DRS的下端)。

clip_image022

Step12、向群集中添加节点(ESX主机),通过图形界面,一般有两种方法,一种是向导的方式,一种是通拖拽的方式。所谓拖拽的方式就是在vCenter Server控制台,直接点上ESX主机,然后按着鼠标左键把ESX主机给拉到树形结构的HA&DRS下方便可。此处采用后者的方式。

选中“esxone.it168test.com”,直接拖拽到“HA&DRS”上。

clip_image024

Step13、在弹出的“选择目标资源池”界面,选择第一项“将此主机的所有虚拟机置于群集的根目录资源中。目录上的资主要由的资源池将被删除”。

clip_image026

Step14、完成后就会出现下面的图示,而且在VC控制台的“近期任务”界面,也会出现进行的状态显示。这个过程也是VMware Ha在ESX主机安装代理的过程,也就是凭借这个代理来进行心跳侦测的。

clip_image028

Step15、将Eesone加入HA&DRS中后,把另外一个节点Esxtwo依同样的方法也加入,过程的选项要确保一致。如果过程中出现错误,可以在近期任务以及“任务和事件”中查看的到。不过一般情况下,就是由于ESX主机名称解析的问题或是资源池不足。

clip_image030

Step17、下图显示了完成后的HA的“摘要”界面,很清楚显示了当前的配置等。同时可以通过点击其它选项来进行相关的查询。至此,完成了VMware HA建立的全部工作。

clip_image032

以上所有,通过图文的方式说明了如何建置VMWARE HA及DRS的,为了更能形象的让大家看到整个过程,本期动手亦提供了有音视频的URL:添加HA及DRS





 本文转自 rickyfang 51CTO博客,原文链接:http://blog.51cto.com/rickyfang/389354,如需转载请自行联系原作者

相关文章
|
存储 Linux 网络安全
借PVE8.0的Debian 12系统配置一下NFS服务器
借PVE8.0的Debian 12系统配置一下NFS服务器
|
机器学习/深度学习 数据采集 人工智能
《智能算法设计与开发的全解析:从理念到实践》
在数字化时代,智能算法作为人工智能的核心驱动力,广泛应用于各行业。设计时需坚持目标导向、数据驱动、平衡复杂性与可解释性、确保鲁棒性;开发中要合理选择算法、编程语言与工具,注重模型训练、验证和部署维护。实践要点包括保证数据质量、综合评估模型、结合领域知识及团队协作。持续学习新技术也至关重要。
436 11
|
安全 JavaScript 数据可视化
Axure高端交互元件库:助力产品与设计
为了在这个竞争激烈的市场中脱颖而出,设计师和产品开发团队需要依赖强大的工具来创造引人注目且功能丰富的交互界面。下面介绍一款Axure精心制作的"Web高端交互元件库",作为一款高端交互元件库已被很多设计者使用,它成为了产品与设计团队不可或缺的得力助手。
507 2
|
SQL 消息中间件 NoSQL
实时计算 Flink版操作报错合集之部署war包的时候,错误提示 "No ExecutorFactory found to execute the application." 如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
570 2
|
监控 关系型数据库 MySQL
数据治理平台Datavines
【10月更文挑战第20天】随着数据量的增长和数字化转型的推进,数据治理成为关键议题。Datavines是一个开源的数据治理平台,提供数据目录、概览及质量检查等功能,帮助用户全面了解和管理数据,确保数据的准确性和有效性。通过简单的部署和配置,即可快速启动使用,支持数据源配置、质量监控及作业管理等核心功能。
2962 10
|
运维 监控 安全
WAN 革命:SD-WAN 与传统 WAN 对比
【7月更文挑战第13天】
1364 1
WAN 革命:SD-WAN 与传统 WAN 对比
|
存储 缓存 JavaScript
性能优化:通用快照方案
本文我们将探讨快照技术如何增强页面性能和用户体验,如何在业务中集成快照方案,以及我们的通用快照解决方案的技术细节。
|
网络协议 程序员 API
网络原理(2)——TCP协议(传输层)
网络原理(2)——TCP协议(传输层)
582 0
|
网络虚拟化 数据安全/隐私保护 数据格式
网络技术基础(9)—— VLAN原理与配置
【3月更文挑战第1天】网络基础笔记(加班了几天,中途耽搁了,预计推迟6天),这篇借鉴了之前师兄的笔记,边听边记笔记实在是太慢了。
|
存储 Linux Windows
技术心得:如何制作ISO镜像文件
技术心得:如何制作ISO镜像文件
1022 0

热门文章

最新文章