禅与计算机维修艺术之fusion computer虚拟机存储恢复

简介: 禅与计算机维修艺术之fusion computer虚拟机存储恢复

问题描述


昨天fusion computer的一台CNA节点,突然挂掉了,重启之后也找不到引导,由于vrm管理平台的虚拟机也部署在那个节点上,vrm没做主备部署,导致了vrm管理平台也无法使用,后来重装了那个坏掉的节点和上面的vrm,虽然这个节点坏了,但另一个节点上的虚拟机还是可以用的,当我准备将原先正常的节点添加到新装的vrm的时候,上面的虚拟机突然都没了,使用virsh list --all查询显示为空,好在查看存储发现数据存储并没丢失


存储数据恢复


进入系统查询数据存储位置,发现数据存储在/POME/datastore_1/vol目录下,但是全是磁盘id,也不知道每个磁盘对应哪个虚拟机,不过我发现文件大小并不一样,我知道不同大小的文件对应的是哪种虚拟机,又数了下磁盘文件的数量发现正好与vrm上的虚拟机和虚拟机模板的数量正好相等


640.png


本来是想在当前节点创建同类型的虚拟机,将之前的磁盘文件的id修改为新创建的磁盘文件的id,然后覆盖新建虚拟机产生的磁盘文件,于是我就在vrm上添加这台机器,添加报错之后重启节点,服务器起来后网络就不通了,连同网段的主机都ping不通,因为华为fusion computer的分布式交换机底层用的是ovs,于是我对比正常CNA节点看了一下,发现这个节点少了一条output的流表,而且这个节点下的端口也少了两个


640.png

640.jpg


我对ovs并不熟,当时只想把数据尽快给恢复出来,就没管网络的事了,想着使用u盘或者移动硬盘把数据拷贝到正常的CNA节点上,结果插上之后不识别NTFS文件系统,需要安装NTFS的驱动,本地并没有NTFS的包,此时又不能联网,只能放弃,后来找了根交叉线直接怼到另一台服务器上,配置IP进行传输,华为的fusion computer对ssh安全的要求比较高,scp传输的时候会验证known_hosts里的key,我是第一次连接那台服务器,报了这个错误


No ECDSA host key is known for 192.168.1.1 and you have requested strict checking.
Host key verification failed.
lost connection


后来加了这个参数使文件正常传输


scp -o  stricthostkeychecking=no /POME/datastore_1/vol/vol_fb5b2975-e6e8-41db-8675-10556bfa8df3/ 192.168.1.1:/home


后面我创建了一个虚拟机,将之前从坏的节点上拷贝的虚拟机磁盘文件名修改成与下面新创建的虚拟机磁盘id相同的文件名,然后覆盖,这个文件夹下有三个文件,一个就是磁盘id命名的img文件了,另一个是snapshot_list.cfg,这里面只写了磁盘id文件名,还有一个是Cnalockfile二进制文件, 我发现当虚拟机从没有开过机的时候是没有这个文件的,那么就可以断定没有Cnalockfile文件的磁盘文件夹就是自己导入的虚拟机模板,有这个文件的就是创建的虚拟机了,拷贝完成后打开虚拟机正常开机,并且是原来的系统


640.png

总结经验


  1. vrm配置主备模式,避免单点故障。


  1. 当时拷贝在新节点拷贝旧节点的文件时发现,同一个分区拷贝40G的虚拟机的文件花了2个多小时的时间,可能是磁盘坏了,事后更换磁盘


  1. 遇到事情先来一波冷静分析,理清问题出在什么地方,事后总结问题,从事故中吸取教训
相关文章
|
10月前
|
存储 SQL 关系型数据库
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
某单位同友存储,存储设备中若干磁盘组建了raid5磁盘阵列。未知原因导致存储设备崩溃无法启动,raid5阵列上层的虚拟机全部丢失,其中存放了重要数据的3台虚拟机需要恢复。
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
|
10月前
|
存储 缓存 固态存储
VSAN存储故障导致虚拟机无法访问的VSAN数据恢复案例
VSAN数据恢复环境: 由四台某品牌服务器组建的VSAN集群,每台节点服务器上有两个磁盘组。每个磁盘组中有1块SSD硬盘+5块SAS硬盘,SSD作为闪存,SAS硬盘作为容量盘。 VSAN故障: VSAN集群中一个节点服务器上其中一个磁盘组中的容量盘出现故障离线,VSAN开始数据的重构迁移,数据迁移还没有完成的时候机房停电导致数据迁移中断。来电后启动所有设备后,管理员发现另一个磁盘组中的两块容量盘出现故障离线,VSAN数据存储出现问题。VSAN管理控制台可以登录,但是所有虚拟机都无法访问。
|
10月前
|
存储 算法 数据挖掘
NetApp数据恢复—NetApp存储中虚拟机的数据恢复案例
NetApp存储数据恢复环境: 北京某公司的一台NetApp某型号存储,通过96块磁盘组建了两组存储池,这2组存储池互为镜像。存储池内划分卷并映射到ESXI作为数据存储使用,卷内有几百台虚拟机。 NetApp存储故障: 操作过程中由于未知原因导致卷丢失,卷内虚拟机无法访问。管理员对该NetApp存储进行检查并试图恢复数据但是没有成功,于是联系我们数据恢复中心恢复数据。
NetApp数据恢复—NetApp存储中虚拟机的数据恢复案例
|
存储 虚拟化 块存储
存储与虚拟机管理 3
存储与虚拟机管理
345 0
|
2月前
|
存储 运维 数据挖掘
|
7月前
|
存储 网络协议 搜索推荐
在Linux中,如何配置和管理虚拟机的网络和存储?
在Linux中,如何配置和管理虚拟机的网络和存储?
|
8月前
|
存储 SQL 运维
服务器数据恢复—Isilon存储误删除vmware虚拟机的数据恢复案例
Isilon存储使用的是分布式文件系统OneFS。在Isilon存储集群里面每个节点均为单一的OneFS文件系统,所以Isilon存储在进行横向扩展的同时不会影响数据的正常使用。Isilon存储集群所有节点提供相同的功能,节点与节点之间没有主备之分。当用户向Isilon存储集群中存储文件时,OneFS文件系统层面将文件划分为128K的片段分别存放到不同的节点中,而节点层面将128K的片段分成8K的小片段分别存放到节点的不同硬盘中。用户文件的Indoe信息、目录项及数据MAP则会分别存储在所有节点中,这样可以确保用户不管从哪个节点都可以访问到所有数据。Isilon存储在初始化时会让用户选择相应的
91 12
|
9月前
|
存储 Java C++
Java虚拟机(JVM)管理内存划分为多个区域:程序计数器记录线程执行位置;虚拟机栈存储线程私有数据
Java虚拟机(JVM)管理内存划分为多个区域:程序计数器记录线程执行位置;虚拟机栈存储线程私有数据,如局部变量和操作数;本地方法栈支持native方法;堆存放所有线程的对象实例,由垃圾回收管理;方法区(在Java 8后变为元空间)存储类信息和常量;运行时常量池是方法区一部分,保存符号引用和常量;直接内存非JVM规范定义,手动管理,通过Buffer类使用。Java 8后,永久代被元空间取代,G1成为默认GC。
87 2
|
10月前
|
存储 关系型数据库 MySQL
服务器数据恢复—EVA存储异常断电重启后虚拟机无法启动的数据恢复方案
服务器存储数据恢复环境: 某品牌EVA8400,服务器上安装VMware ESXi虚拟化平台,虚拟机的虚拟磁盘包括数据盘(精简模式)+快照数据盘,部分虚拟机中运行oracle数据库和mysql数据库。 服务器存储故障&检测: 存储异常断电重启后,存储中一台虚拟机无法启动。工作人员推测故障原因是异常断电导致电源模块出现故障,清空cache后重新启动存储发现该虚拟机仍无法正常启动。
|
虚拟化 Windows
M1/M2 Pro VMware Fusion虚拟机安装Win11教程(超详细) 3
M1/M2 Pro VMware Fusion虚拟机安装Win11教程(超详细)
1532 1

热门文章

最新文章