CA ARCserve Backup系列(5)—使用“重复数据删除”备份-阿里云开发者社区

开发者社区> 余二五> 正文

CA ARCserve Backup系列(5)—使用“重复数据删除”备份

简介:
+关注继续查看

在 CA ARCserve Backup 中,重复数据消除是只能处理备份服务器上的单个会话。如果是要备份两台服务器(例如C盘),而这两台服务器有很多文件是相同的,则需要使用 “全局重复数据消除” 。

下面是CA 执行dedup的过程——

在第一次备份过程中:

(1)、CA ARCserve Backup 扫描传入数据并将其分解成块。此进程在磁带引擎的 SIS 层进行。

(2)、 CA ARCserve Backup 执行哈希算法,该算法会为每个数据块指定唯一的值,然后 CA ARCserve Backup 会将这些值保存到一个哈希文件中。 
(3)、CA ARCserve Backup 比较哈希值。当发现重复数据之后,数据仅写入 磁盘一次,并且引用将添加到引用文件(指向首次识别的该数据块实例的存储位置)。

在后续备份过程中:

(1)、CA ARCserve Backup 扫描传入数据并将其分解成块。

(2)、CA ARCserve Backup 执行哈希算法以指定哈希值。 
(3)、 CA ARCserve Backup 将新的哈希值与先前的值进行比较,以查找重复数据。如果发现了重复数据,则数据将不写入磁盘, 而是使用数据块原始 实例的存储位置来更新引用文件。

另外可以使用优化以获得更好的吞吐量并减少对 CPU 的占用。启用优化后, CA ARCserve Backup 会扫描文件属性,查找文件标头级的更改。如果没有更改,则不对这些文件执行哈希算法,文件也不会复制到磁盘。哈希算法仅会对自上次备份后有所更改的文件运行。仅在 Windows 卷中支持优化。不支持对基于数据流的备份的优化,例如 SQL VDI、Exchange 数据库级、Oracle 和 VMware 映像级备份。

下面是做的dedup的实验。

step1、在启动项中选择“重复数据消除备份”

image

step2、在源中选择备份一个18.02M的电子书

image

step3、在“目标”项中选择创建的“重复数据消除设备dedup1”,在如下图的右下角可以看到dedup1设备的详细信息

image

step4、备份完成

clip_image002[9]

step5、可以看到在备份目录的“数据文件”中多了“000”这个文件夹

clip_image002[11]

  看到“000”目录下的备份数据是18982KB。

clip_image004

注:数据文件存储已备份数据的唯一实例。

step6、再看“索引文件”中多了如下一些内容,

clip_image006

  “000”目录中包括如下内容,其中由一个计算源文件得到的hash值的文件*.hash

clip_image008

注: 

  哈希文件 - 存储为每个冗余数据块分配的标记。 
  引用文件 - 计算哈希数量,并将地址存储到与各哈希相对应的数据文件中。

step7、再次备份18.02的电子书。可以看到数据文件中并没有大的变化,知识多了个49KB的“000000002.data”文件。clip_image010

step8、看到多了“000000002.hash”文件和“000000002.ref”文件,两次hash计算得到的值是一样的。说明已经成功地经过SIS后再存储备份文件。

clip_image012





本文转自 taojin1240 51CTO博客,原文链接:http://blog.51cto.com/taotao1240/839237,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
CSS IE6/7/8, Firefox, Safari, Chrome, Opera Hack使用简要归纳(转)
网上有很多关于IE6/7/8, Firefox, Safari, Chrome, Opera CSS Hack的文章,但我觉得太过繁杂,要不给出一张看也看不懂的CSS Hack归纳表,要不就是给出一大堆代码说明问题,不便于学习与使用。
879 0
Kubernetes应用迁移至ACK(二) Kubernetes应用及PV数据迁移
本文记录使用Velero快速完成云原生应用及PV数据从自建Kubernetes迁移到ACK的实践过程。 此过程也同样适用于其他云厂商Kubernetes集群内的应用及PV数据迁移至ACK。 在本示例中, 我们将对自建Kubernetes集群中的一个wordpress应用整体迁移上云到ACK,其中数据备份采用阿里云OSS服务,安全稳定。 ## Kubernetes应用及PV数据迁移ACK概览
577 0
SQL SERVER数据库删除LOG文件和清空日志的方案
原文:SQL SERVER数据库删除LOG文件和清空日志的方案 数据库在使用过程中会使日志文件不断增加,使得数据库的性能下降,并且占用大量的磁盘空间。SQL Server数据库都有log文件,log文件记录用户对数据库修改的操作。
4113 0
关于结构体占用空间大小总结(#pragma pack的使用)
关于C/C++中结构体变量占用内存大小的问题,之前一直以为把这个问题搞清楚了,今天看到一道题,发现之前的想法完全是错误的。这道题是这样的: 在32位机器上,下面的代码中 class A { public: int i; union U { ...
802 0
Observability:使用 Elastic Stack 分析地理空间数据
在今天的文章中,我们将参考之前的文章 “如何使用 Elasticsearch ingest 节点来丰富日志和指标”。我们可以利用 Elasticsearch ingest 节点来更加丰富我们的数据,并对这些数据做更进一步的的分析。
1110 0
使用ServiceStack.Redis实现Redis数据读写
原文:使用ServiceStack.Redis实现Redis数据读写 User.cs实体类 public class User { public string Name { get; set; ...
1445 0
javascript callback函数的理解与使用
最近做的一个项目中用到了callback函数,于是就研究了下总结下我对javascript callback的理解 首先从callback的字面翻译“回调” 可以理解这是一个函数被调用的机制 当我们遇到一个名词首先可能是百度谷歌搜索看官方是怎么解释的下面是维基百科对回调的定义: a callba...
508 0
+关注
12613
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载