数据恢复比备份费时的五个原因

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 备份数据可能很快,但由于访问备份并将其恢复到实时网络上需要几个步骤,恢复速度可能会很慢。

发现恢复比备份还要费时,许多人感到很惊讶,但这一点都不奇怪。事实上,每个人都应该为这种差异做好计划,并纳入到备份设计中。

以下是恢复起来通常比备份慢的五个原因。

RAID写开销
大多数现代磁盘阵列使用基于奇偶校验的独立磁盘冗余阵列(RAID)来构建,RAID级别从3到6。其他磁盘阵列使用纠删码来构建,这与基于奇偶校验的RAID面临相似的挑战。

将数据写入阵列时,基于奇偶校验的RAID需要计算奇偶校验信息。从这同一个阵列读取数据时不进行这种计算,因此读比写快得多。写开销对性能的影响可能很小,也可能很大,这取决于RAID级别及/或纠删码中使用的设置。但所有这种阵列都面临一些写开销,您需要找出自己的写开销有多大。

写时拷贝快照
与写开销相似的一个概念是,在使用写时拷贝快照的阵列和NAS文件管理器中发生的情况。当您创建写时拷贝快照时,它只是将一根棍子立在地上作为参考点。最初创建快照时,几乎不会发生I/O;所有的重活都在之后发生。写操作试图覆盖需要为快照保存的块时,该块会在允许继续写操作之前拷贝到快照区。这就是为什么名为写时拷贝。

与RAID写开销一样,这仅在写入时发生。快照开销也可能非常大,因为它取决于保存在该特定卷上的快照数量。更多的快照加大了在写操作继续之前需要拷贝单个写内容的机会;因此,写时拷贝卷上的快照越多,写新数据时的性能就越差。

写入到文件系统
下一个写开销出现在写入到文件系统时,尤其是含有数百万个文件的密集系统时。当您恢复文件时,文件系统必须先创建一个文件来恢复该数据。该文件的创建是单独的操作,无论文件大小如何,都需要耗费时间。如果有数百万个文件要恢复,这个文件创建时间实际上可能比恢复本身所花的时间还长。

不堪重负的事务日志
关系型数据库具有跟踪数据库所有更改的事务日志。数据库在事务日志中快速记录事务的能力通常不是大多数数据库设计中必须考虑的方面。然而,大型恢复每秒创建的事务可能比平常工作日需要创建的事务多得多,因而给事务日志带来了比平常大得多的负载。因此,事务日志也会减慢恢复速度。

多路备份流
考虑恢复比备份慢时要注意的最后一方面是多路(multiplexing)。好消息是,只有直接从磁带恢复时,才会出现这种开销。如果备份系统基于磁盘,不会出现这个问题。这实际上是过去二十年来许多人放弃磁带的主要原因。

要理解这个问题,应考虑磁带驱动器的主要问题:它们比实际需要的速度快得多。现代流式磁带驱动器的速度比典型增量备份的速度快10倍到20倍。为解决这个问题,业界开发了多路技术:将多个备份流交织成一个流,其速度快得足以让磁带驱动器满意。20年前多路开发出来时,这个领域的大多数人觉得别无选择,因为他们必须让磁带驱动器满意,才能进行成功的备份。然而,恢复面临庞大的开销。

如果您从多路磁带恢复,备份软件必须读取整个磁带,并丢弃除您需要的流之外的所有流。如果多路设置为10,磁带驱动器必须读取所有10路流,丢弃其中的9路流。这对恢复速度有很大影响。如果将其与上述某种写开销结合起来,情况可能会变得更糟。如果磁盘驱动器无法像磁带驱动器读数据一样快地写数据,磁带驱动器不得不停止和启动,以便磁盘驱动器跟上速度。

评估恢复延迟,设定预期
找出环境存在什么样的恢复速度开销,然后纳入到备份设计中,这点很重要。在您要恢复数据的每种类型的系统上对每种不同类型的数据执行测试恢复。这包括您在数据中心、每个大型文件服务器中使用的每种不同类型的RAID。搞清楚什么样的恢复速度是规定的恢复速度,然后询问供应商可以怎样加快这个恢复速度。

随后对大型恢复期间会发生什么准确地设定预期。开会讨论恢复重要的文件服务器需要多长时间,并向受影响的人解释为什么会这样。供应商可以帮助解释它是否无能为力,您可以接受这一点,也可以研究一种全然不同的备份技术。

重要的是在需要恢复任何数据之前做好所有这些工作。尽可能全面地进行恢复测试,看看恢复比备份慢的程度,并相应地调整设计和预期。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
6月前
|
数据挖掘 Windows
【服务器数据恢复】服务器迁移数据时数据丢失的数据恢复案例
一台安装Windows操作系统的服务器。工作人员在迁移该服务器中数据时突然无法读取数据,服务器管理界面出现报错。经过检查发现服务器中一个lun的数据丢失。
|
11天前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
88 50
|
15天前
|
存储 关系型数据库 数据库
数据备份和恢复的常见技术
【10月更文挑战第28天】数据备份和恢复的常见技术
|
4月前
|
存储 SQL 运维
服务器数据恢复—Isilon存储误删除vmware虚拟机的数据恢复案例
Isilon存储使用的是分布式文件系统OneFS。在Isilon存储集群里面每个节点均为单一的OneFS文件系统,所以Isilon存储在进行横向扩展的同时不会影响数据的正常使用。Isilon存储集群所有节点提供相同的功能,节点与节点之间没有主备之分。当用户向Isilon存储集群中存储文件时,OneFS文件系统层面将文件划分为128K的片段分别存放到不同的节点中,而节点层面将128K的片段分成8K的小片段分别存放到节点的不同硬盘中。用户文件的Indoe信息、目录项及数据MAP则会分别存储在所有节点中,这样可以确保用户不管从哪个节点都可以访问到所有数据。Isilon存储在初始化时会让用户选择相应的
74 12
|
3月前
|
固态存储 Java
磁盘误删卷数据恢复工具
磁盘误删卷数据恢复工具
36 0
|
6月前
|
存储 Oracle 关系型数据库
服务器数据恢复—北亚企安服务器数据恢复案例集锦
服务器数据恢复案例之服务器raid6中3个磁盘离线导致阵列崩溃的数据恢复案例 服务器数据恢复案例之服务器RAID5两个磁盘指示灯显示红色导致服务器崩溃的数据恢复案例 服务器数据恢复案例之服务器硬盘出现坏道/坏扇区离线导致服务器崩溃的数据恢复案例
|
6月前
|
存储 运维 数据挖掘
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
服务器数据恢复环境: 数台服务器+数台存储阵列柜,共上百块硬盘,划分了数十组lun。 服务器故障&检测: 外部因素导致服务器进水,进水服务器中一组阵列内的所有硬盘同时掉线。 北亚数据恢复工程师到达现场后发现机房内有一台存储柜中的机器都没有开机。和用户方沟通后得知:机房天花板渗水导致这台存储柜中最上方的两台服务器进水,其中一台服务器经过检修后可以正常工作,但是最上方的那台服务器则完全损坏。
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
|
6月前
|
运维 Oracle 关系型数据库
【服务器数据恢复】服务器硬盘坏道掉线的数据恢复案例
服务器数据恢复环境: 一台IBM某型号服务器上有16块FC硬盘组建RAID阵列。上层linux操作系统,ext3文件系统,部署有oracle数据库。 服务器故障&检测: 服务器上跑的业务突然崩溃,管理员发现服务器上有2块磁盘的指示灯显示黄色。
|
运维 数据挖掘 数据库
服务器数据恢复—虚拟机误还原快照的数据恢复案例
服务器数据恢复环境: vmfs文件系统,存放的是SqlServer数据库及其他办公文件。 服务器故障: 工作人员误操作还原快照,导致了SqlServer数据库数据丢失。
|
存储 Unix BI
数据备份和恢复方案(1)
数据备份和恢复方案(1)
243 0