如何解决VMware ESX虚拟机假死或无法关闭和启动问题(转)

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:

虚机状态无法改变,任务停止在启动过程中、比如还有删除快照的时候感觉好像进程 是死在那里,任务列表显示 Power on virtual machine:in progress 一直不结束,虚拟机的各种按钮都是灰色的,仅有电源按钮处于按下的状态,无法对此虚拟机进行任何操作。

以及出现Vcenter 自动断开的情况。

一般原因是由于ESX上与VC/VIC通讯的服务有故障,VM状态混乱.

如果是服务有故障

那么尝试重启hostd和vpxa服务。

Hostd服务负责管理ESX上的大部分操作,vpxa服务是管理代理,用于处理主机和客户端之间的通讯,客户端包括vCenter Server和任何连接到ESX的VI client。

重启hostd服务,service mgmt-vmware restart。

重启vpxa服务,service vmware-vpxa restart。

VM状态混乱:

vmware-cmd vmfs/volume/vmfslabel/vmname/vmname.vmx stop

vmware-cmd vmfs/volume/vmfslabel/vmname/vmname.vmx start

如果命令无法执行, 强制关闭该VM的进程.

ps -ef | grep <vmname>    (注意确定VM的PID)

kill -9 pid

然后按正常方法启动VM

载入如果出现VC的通信故障或者VC无法连接,登录到VC主机

重启VC服务

 

这里再提一个技巧,如果你是SERVER2008的系统,将上述服务设置延时启动(自动)可以解决有时候VC无法连接到数据库的问题,特别是VC和SQL装在一台服务器上的情况,建议安装VC时候将VC和SQL分开安装。


 

虚拟机与物理服务器的差别突出了解决虚拟机问题的特殊挑战。在物理服务器重新启动之前,你可以切断电源作为最后的手段解决问题。不过这个策略不适合虚拟机,因为它只有虚拟电源开关。有一些工具包可以帮助预防问题或使检修过程更容易。在这篇文章中,TechTarget中国的特约虚拟化专家Eric Siebert将讨论这些工具包,并逐步解释怎么样修理各种常见的问题。

VMware工具

你自己所熟悉的第一套工具是VMware的工具。VMware工具是一套增强型驱动和应用程序,安装在虚拟机操作系统上。最好的做法是要养成一个习惯——随时安装VMware工具以确保虚拟机的最佳性能和稳定性。并且安装任何升级补丁到ESX后(一些ESX补丁偶尔也需要更新到VMware工具),要反复查看以确信你运行的是最新版本的VMware工具。在VMware Infrastructure客户端的虚拟机窗口上有一栏,这一栏显示了每台虚拟机VMware工具的状况——是否运行正常、是否过期或未安装。

虚拟机文件类型

作为检修过程的一部分,你需要了解所有不同的文件类型。我们来看看这些与虚拟机相关的文件:

.nvram file——这个文件包含了虚拟机的CMOS/BIOS。 
.vmdk files——这些是磁盘文件,为虚拟机里的每个虚拟硬驱动创建的。使用vmdk扩展名的文件有以下三种类型:
*–flat.vmdk file——这是为每个虚拟硬驱动创建的真实的原始文件。 
*.vmdk file——这是磁盘描述文件,描述了虚拟磁盘文件的大小和形状。 
*–delta.vmdk file——这是一个特定的文件,当你对虚拟机进行快照时创建的(也是REDO重做日志)。
.vmx file——这个文件是虚拟机最初配置文件。当你创建一台虚拟机并进行硬件配置时,这些信息存储在这个文件里。 
.vswp file——这是虚拟机swap交换文件(早期的ESX版本在每台主机上都有SWAP文件),这个文件允许ESX服务器增加新的虚拟swap空间。 
.vmss file——这个文件创建于虚拟机暂停模式下,用于保存暂停时的状态。 
.log file——这是记录虚拟机活动日志的文件,用于检修虚拟机故障。 
.vmxf file——这是文本格式的附加配置文件,为同一组虚拟机创建。 
.vmsd file——这个文件用于存储关于快照的元数据和信息。 
.vmsn file——这个是快照状态文件,存储了使用快照时虚拟机当时运行状态的信息。
日志文件

了解了虚拟机文件类型,我们来看看日志文件。日志文件是解决虚拟机问题的最好途径。当问题发生时,这是你首先需要检查的。

最重要的文件是Vmware.log file。这是ESX服务器上的虚拟机主要的日志文件,位于工作目录。Vmware.log通常是目前的工作日志,旧的日志文件以数字上的增加来表示,例如,vmware-1.log。

在ESX主机上,你也需要检查/var/log/vmkernel和 /var/log/vmware/hostd日志,以查看是否与虚拟机故障有关。有时,重新启动ESX主机上的主机服务将解决棘手的虚拟机问题。对于更多的常见问题,有很多技术可以解决。下面讲到一些这样的问题。

问题一:不能关闭虚拟机

其实是不能用虚拟电源控制器关闭虚拟机。你可以采用命令行的方法试着手动地注销虚拟机。下面列举了好几种方法。在决定采用重新启动ESX主机之前,试试这些方法。

1.通常尝试的第一种方法是使用vmware-cmd命令行。

登陆服务控制台
键入“vmware-cmd –l”得到所有虚拟机及其路径的列表
键入“vmware-cmd //.vmx getstate”查看虚拟机状态
强制关闭“vmware-cmd //.vmx stop hard”
再次检查虚拟机状态,现在应该是关闭着的
键入“vmware-cmd //.vmx start”启动虚拟机

2.第二种选择是手动注销虚拟机,通过找到虚拟机进程标识符(pid)并使用注销命令终止它。

登陆服务控制台
键入“vmware-cmd –l”得到所有虚拟机及其路径的列表
键入“vmware-cmd //.vmx getstate”查看虚拟机状态
键入“ps -ef | grep”
第二栏显示虚拟机vmkload_app的进程标识符pid,你也可以输入“ps –eaf”查看所有的运行进程
键入“kill -9 pid”
重新查看虚拟机状态,现在应该是关着的
键入“vmware-cmd //.vmx start”启动虚拟机

3.最后一种方法是使用vm-support命令强制关闭虚拟机

登陆服务器控制台
键入“vm-support –x”或“cat /proc/vmware/vm/*/names”,选择你要关闭的虚拟机标识符
键入“vm-support –X”注销虚拟机及生成内核转储(core dumps)
提示你是否保存虚拟机屏幕截图,发送NMI到虚拟机并发送终止命令。你需要点击确定按纽来注销虚拟机。整个过程需要5到10分钟运行。这将在目录里创建一个报告存档(tar archive)。

问题二:不能启动虚拟机

另一个常见问题可能是不能启动虚拟机。这种情况发生在主机服务器没有虚拟机要使用的足够资源。例如,如果虚拟机有一个内存预留设置(memory reservation),ESX主机没有足够的物理内存来满足要求,虚拟机就不能启动。如果发生这样的情况,你可以选择删除虚拟机的内存预留,把虚拟机迁移到另一台有更多剩余物理内存的主机上,或者选择把现有主机上的物理内存空出来。

同样,当虚拟机启动时,需要在ESX主机上的虚拟机工作目录里创建一个vswp文件,这个文件与分配给虚拟机的RAM(减去任何内存预留)大小一样。如果你的ESX主机没有足够硬盘空间的话,也不能启动虚拟机。工作区设置的内存预留大小与分配给RAM大小一样,所以vswp文件尺寸将是0字节。不过,你要注意在VMFS(虚拟机文件系统)卷上预留额外的磁盘空间给日志、swap交换文件和快照等,这一点很重要。

问题三:虚拟机由于操作系统损坏遇到启动错误

如果虚拟机由于操作系统损坏或错误配置在启动时出现问题,解决这个问题的方法是添加它的虚拟磁盘到另一个运行着的虚拟机,因此,你能访问驱动并作出必要的修理。为了修理有问题的虚拟机,你要确保这台虚拟机是关闭着的。下一步是添加额外的驱动到工作着的其他虚拟机并浏览有问题的虚拟机的磁盘文件。启动工作着的虚拟机。现在,你能访问有问题的虚拟机的驱动以作出任何改变和改正。从工作着的虚拟机移除驱动,添加到有问题的虚拟机,然后试着重新启动。

问题四:普遍的虚拟机操作系统问题

为了检修虚拟机操作系统的问题,我创建了一个ISO文件工具包,包含有用的检修应用程序,它能很快地启动虚拟机的CD-ROM并能用来修理(或启动)虚拟机。我使用的一些ISO文件包括下面几种:

Sysinternals工具——检修Windows服务器问题的好工具。
Gparted——基于Linux的磁盘分区编辑器。
Knoppix——基于Linux的CD盘,包罗许多工具很应用程序。
Ultimate Boot CD——包含许多系统修理和测试工具的CD盘。
UBCD4Win——基于Windows的CD盘,包罗许多系统修理和测试工具。

总结

检修虚拟机问题时,上面列出了一些问题和需要使用的技术。当你下次遇到虚拟机故障时,文章里的这些信息应该能够帮助你。










本文转自 qq8658868 51CTO博客,原文链接:http://blog.51cto.com/hujizhou/1040037,如需转载请自行联系原作者
目录
相关文章
|
1月前
|
存储 网络安全 虚拟化
虚拟化数据恢复—VMware ESX Server数据恢复案例
虚拟化数据恢复环境: 某企业信息管理平台, 几台VMware ESX Server主机共享一台存储设备,大约有几十台虚拟机。 虚拟化故障&原因: Vcenter报告虚拟磁盘丢失。管理员通过ssh远程到ESX中执行fdisk -l命令查看磁盘,发现STORAGE已经没有分区表了。重启所有设备后,ESX SERVER均无法连接到存储设备中的STORAGE。
|
10天前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
88 50
|
7天前
|
存储 网络安全 虚拟化
虚拟化数据恢复—VMware ESX SERVER数据恢复案例
虚拟化数据恢复环境&故障: 某单位信息管理平台,数台VMware ESX SERVER共享一台某品牌DS4100存储。 vc报告虚拟磁盘丢失,管理员ssh到ESX中执行fdisk -l查看磁盘,发现STORAGE中的分区表不见了。重启所有设备后,ESX SERVER均无法连接到DS4100存储中的STORAGE。
|
1月前
|
安全 虚拟化 数据中心
Xshell 连接 VMware虚拟机操作 截图和使用
Xshell 连接 VMware虚拟机操作 截图和使用
49 4
|
1月前
|
Linux 虚拟化
vmware虚拟机安装2024(超详细)
vmware虚拟机安装2024(超详细)
281 6
|
1月前
|
虚拟化 网络虚拟化 网络架构
虚拟机 VMware Workstation 16 PRO 的网络配置
虚拟机 VMware Workstation 16 PRO 的网络配置
|
2月前
|
存储 SQL 数据挖掘
虚拟化数据恢复—VMware虚拟机vmdk文件被误删除的数据恢复案例
虚拟化数据恢复环境: 某品牌服务器(部署VMware EXSI虚拟机)+同品牌存储(存放虚拟机文件)。 虚拟化故障: 意外断电导致服务器上某台虚拟机无法正常启动。查看虚拟机配置文件发现这台故障虚拟机除了磁盘文件以外其他配置文件全部丢失,xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。管理员联系VMware工程师寻求帮助。VMware工程师尝试新建一个虚拟机来解决故障,但发现ESXi存储空间不足。于是将故障虚拟机下的xxx-flat.vmdk磁盘文件删除,然后重建一个虚拟机并且分配固定大小的虚拟磁盘。
|
3月前
|
虚拟化
vmware虚拟机使用主机代理访问谷歌
vmware虚拟机使用主机代理访问谷歌
|
5月前
|
Unix Linux 虚拟化
虚拟机VMware知识积累
虚拟机VMware知识积累