因为多台虚拟机共用同一台物理计算机,所以一台物理计算机的故障会导致多台虚拟服务器业务停止。因此避免单点故障保证业务的连续运行就显得尤为重要。使用NEC的面向虚拟机的高可用集群解决方案,在故障发生时能够自动将业务或虚拟服务器整体切换到备机上,可以很好地解决单点故障的问题,保证系统能够365天24小时不间断运行。
方案内容
产品组成
NEC的虚拟机高可用解决方案由虚拟机产品VMware和高可用集群产品EXPRESSCLUSTER组成。
EXPRESSCLUSTER可以全面监视虚拟服务器以及物理服务器上的各种软、硬件资源(包括虚拟硬件资源)的状态。一旦被监视项目发生故障,则可以根据故障类型,在虚拟服务器之间或物理服务器之间自动进行切换,保证业务连续运行。同时,可以通过EXPRESSCLUSTER来统一管理虚拟服务器,通过特定设置,在故障发生时将信息通知管理员,方便系统管理员的管理,降低维护成本。
此外,通过结合使用VMware的虚拟架构管理中的VMotion功能,可以在保证系统高可用性的同时进一步减少系统计划内宕机时间。
功能特点
全方位实时故障监视
可以监视网络、存储、服务器、操作系统、应用软件、VMware、EXPRESSCLUSTER自身服务状态,以及待机服务器上的软硬件资源的状态。EXPRESSCLUSTER的独特的内核心跳技术,在进行服务器之间的状态探测时,可以不受系统负荷的影响。另外,除了支持网络心跳外,还可以通过COM口、存储设备上的特定分区、以及Ping第三方的方式确认服务器的状态。
丰富的应用程序监视选件
EXPRESSCLUSTER的监视选件通过Agent模块定期对应用程序进行实际访问处理,探测应用的响应时间、返回结果等状态。可以对应用进行深层次状态监视,实现迅速准确的故障诊断。EXPRESSCLUSTER的监视选件可以支持数据库服务器,互联网服务器,文件服务器,应用服务器这4个领域内的几乎全部主流应用。
灵活的集群配置方式
EXPRESSCLUSTER可以支持在虚拟机软件的GuestOS之间进行故障切换,也可以用虚拟机对物理服务器作备份。此外,通过EXPRESSCLUSTER的镜像同步通能,可以对虚拟机上的特定分区的数据进行实时镜像复制,保证数据资产的安全。
简便的维护操作
利用EXPRESSCLUSTER基于B/S结构的集中管理工具,可以进行跨平台远程管理与操作。并且可以可同时管理多个集群(Windows与Linux集群均可)的状态。EXPRESSCLUSTER简便易用的集群配置工具实现了集群配置信息的导入导出和离线编辑,在构筑大量结构相似的集群的时候,只要将一个集群的配置信息,复制后作简单修改就可以导入到其他的集群。对于减少配置操作的工作量非常有效。
技术路线
虚拟机技术可将一台物理计算机虚拟成多台计算机,它可以使多个不同的操作系统同时、独立地运行。
随着CPU多核技术的日臻成熟,强大的硬件能力使单机运行多个独立应用平台更显游刃有余。并且,使用虚拟机作服务器可以提高机器的使用效率,大幅节省硬件成本。下图就是一个将5台服务器用虚拟机整合到1台双CPU的物理计算机上的实际案例,硬件利用率明显提高。
使用虚拟机作服务器的好处非常突出,但是缺点也很明显。因为多台虚拟机共用同一台物理计算机,所以一台物理计算机的故障会导致多台虚拟服务器业务停止。因此避免单点故障保证业务的连续运行就显得尤为重要。
使用NEC的面向虚拟机的高可用集群解决方案,在故障发生时能够自动将业务或虚拟服务器整体切换到备机上,可以很好地解决单点故障的问题,保证系统能够365天24小时不间断运行。
成功案例
在某大型图书馆的管理系统中,有一台Windows平台的图书管理服务器和一台Linux平台的数据库服务器,一直处于单机运行状态。虽然系统负荷并不大,但是由于平台不同,如果要实现系统高可用必须再购买两台服务器。而我们利用该解决方案,使用两个不同平台的虚拟机对这两台服务器进行备份,就只需要一台物理服务器,最大程度地减少了硬件成本支出。