开发者社区> 余二五> 正文

VMware vSphere 5.1 群集深入解析(八)

简介:
+关注继续查看

第八章 集成

现在你知道HA从里到外如何工作了吧,我们要在HA,DRS,SDRS和其它组件或者功能中解释不同的点,我们觉得值得一提,尽管承认有些信息还不够成熟,但我们觉得它是这本书非常重要的一部分。

HA与无状态ESXi

vSphere 5.0引入了一个非常牛掰的功能-无状态ESXi,无状态ESXi意味着不需要启动磁盘,也就是说,没有USB磁盘、SD磁盘、本地磁盘或者SAN启动,ESXi可以通过PXE启动,并直接加载文件到内存中。但是,它也增加了一些有趣的挑战,当主机被重新启动,HA代理也启动,他们需要的HA配置信息会怎么样?对于无状态ESXi主机,我们依靠Auto Deploy Server去为HA代理存储配置信息,当主机开启或者重启,HA的代理将会重新初始化,vSphere 5.1自动部署镜像,镜像包括默认的HA VIB文件,并且在主机开启或者重启后不需要安装HA代理。

我们在第二章节中描述了配置文件, Auto Deploy Server缓存了HA所需的配置文件,vCenter的版本文件是HA所必需的,因为这些文件会不断变化,所以自动部署管理主机需要正确的缓存副本文件。

HA和存储DRS

当发生故障,vSphere HA会通知存储DRS,以防止迁移HA保护的虚拟机,也就是说,一台开启电源的虚拟机发生故障了,因为可用容量不足,它不会立即重启,此外,除了vCenter通告执行的虚拟机,存储DRS不允许存储迁移其它虚拟机,因为这种情况下,HA不会重新保护该虚拟机直到vCenter Server再次锁定数据存储。

存储迁移和HA

在vSphere 5.0中存储迁移进行了一定的修订,我们在第二、三章中进行详细描述,但要在本段讨论HA的整合,如果启用HA的情况下,一台虚拟机需要重新启动,虚拟机在存储迁移的过程中发生了故障,重启的进程不会触发直到vCenter 通知master存储迁移任务完成,或者存储任务已回滚,如果资源主机发生故障,虚拟机作为正常工作流的一部分将会启动,在存储迁移期间,存储迁移所在的主机的代理将被初始化,覆盖虚拟机发生故障的状态。如果,无论什么原因,vCenter不可用,15分钟后将覆盖虚拟机的状态来保证虚拟机将被重启。

还注意到vSphere 5.0 U1及其以上版本,当存储迁移完成,vCenter会报告虚拟机未保护状态直到master报告虚拟机在新的路径下再次被保护。

HA和DRS

vSphere 4.1的HA功能,集成了DRS在多个层面上进行了集成,这是个非常大的进步,我们想要强调的东西是,HA在行为和可靠性方面发生了改变。

HA和资源碎片

当触发故障转移,HA首先检查目标主机上是否有可用资源,例如,一个特定的虚拟机,有非常大的预留资源,接入控制策略是基于百分比的,例如,它可能发生资源分布在多台主机上,(关于这个场景更详细的描述见第7节),在vSphere 4.1的HA,将会问DRS关于碎片资源,以适应虚拟机的需求,尽管HA要求的碎片资源不能给予保证,因此,额外的集成,当涉及到资源碎片,你应该保持谨慎。

 

共享份额

在vSphere 4.1之前,当客户设置虚拟机资源共享时,一个问题可能会出现,当开启HA功能的群集中虚拟机发生故障,它会在其它资源池内开启虚拟机,但是,用户配置了虚拟机的份额,而不是资源池自动进行调整,这可能会导致虚拟机接收太多或太少的配额资源。

 

那么以下情景将可能会发生:群集内有VM1和资源池A,VM1占用资源1000份,资源池A有2000份,但是资源池A有2个虚拟机,每个虚拟机占用“2000”份的50%,下面描述这个情景:

图34:共享份额记录

image

当主机发生故障,VM2和VM3的资源占用将和VM1在一个级别上,然而客户定义了VM2和VM3的份额为10000,VM1完全没有资源争用的优势,在下面的图中将会描述。

图44:主机故障后的份额

image

这种情况将持续下去,直到下一次调用DRS,重新将VM2和VM3加入到原来的资源池,为了解决这个问题,在vSphere 4.1 中,HA在虚拟机故障切换时计算份额值,这个过程保证虚拟机在没有正确的资源池的情况下获取资源,这个场景时下面的图,注意VM2和VM3在根资源池中的位置以及份额值1000.

图45:主机发生故障后,DRS调用前,份额

image

当然,调用DRS时,VM2和VM3都被从新分到根资源池下,将再次收到原有分配的份额。

(话说4.1之前的版本不支持计算么?如果主机发生故障,资源池这一级将不生效,虚拟机按照份额占用群集所有资源,DRS 5分钟检测一次,所以。。。。。)

DPM和HA

如果DPM功能开启,HA故障切换期间资源紧缺,HA会使用DRS尝试调整群集资源(例如,通过主机退出待机模式或者迁移虚拟机来整理资源),使HA能够执行故障切换

如果HA启用了严格的接入控制策略(默认),DPM为了满足HA故障切换的容量需求,将保持必要的资源水平,如果违反的接入控制策略,HA将进行约束,防止DPM关闭太多的ESXi主机。

vSphere 5.0中,当HA接入控制被禁用,HA将会阻止DPM关闭所有的主机,除非群集中只有一台主机,无论资源多么紧张,最少要保障群集内有两个主机,原因是当发生故障,群集内只有一台主机,虚拟机不可能重新启动。

在故障场景中,如果HA无法启动一些虚拟机,它会要求DRS/DPM尝试进行分散资源整理,或者将主机退出待机模式,来支持HA有机会重新启动虚拟机,另一个变化是DRS/DPM启动主机或者保持主机都必须要依靠群集约束,即使这些主机利用率很低。再次,一个成功的DRS需要启用和配置全自动,当没有配置全自动的用户需要按照DRS的推荐执行,从而允许发生虚拟机重新启动。

 

第九章 汇总

我们希望,我们已经成功的给你一个最好方式来理解HA的内部运作。

我们希望这本书能够帮助你,能把它当做更新你的vSphere环境的工具,并最终提供您环境的弹性和正常运作时间。






本文转自 tim2009 51CTO博客,原文链接:http://blog.51cto.com/virtualbox/1184014,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
深度解析容器服务Kubernetes集群容量以及网络规划
#背景 在目前云原生技术被如火如荼的大规模使用的过程中。越来越多的用户都会使用Kubernetes集群去部署其应用。但是在这个过程中,如果由于早期对于容量和网络的规划不当,可能造成实际生产中实践中,不能满足业务的真实需要。如果此时在重新规划就面临着集群重建、应用迁移的诸多事项,这样不仅仅浪费了大量的精力,甚至可能会造成业务有一定的中断。因此,为了使得广大使用者可以更加深入的理解阿里云容器服务Ku
1094 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
28494 0
【spring 配置文件】spring配置文件的解析
一.总体结构   二.详解 1.spring 标签   在对bean进行定义时,除了使用id属性来指定名称之外,为了提供多个名称,可以使用alias标签来指定。而所有的这些名称都指向同一个bean,在某些情况下提供别名非常有用,比如为了让应用的每一个组件能更容易的对公共组件进行引用。
669 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
20371 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
23547 0
Spring Cloud 上手实战-架构解析及实作
Spring简介 为什么要使用微服务 单体应用: 目前为止绝大部分的web应用软件采用单体应用,所有的应用的用户UI、业务逻辑、数据库访问都打包在一个应用程序上。 缺点: 开发相互干扰,随着应用的不断升级沟通协调成本增加 应用上线由于某个功能升级导致需要整体的构建、整体测试、整体发布 微服务 把单体应用拆分成小的、松藕合分布式服务的形式 每个应用一定是独立构建、独立部署与测试,应用也是独立发布,应用于应用直接通常通过restful API接口的形式进行相互调用。
1710 0
+关注
20378
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载