Attic——删除重复数据的备份程序-阿里云开发者社区

开发者社区> 玄学酱> 正文

Attic——删除重复数据的备份程序

简介:
+关注继续查看

Attic——删除重复数据的备份程序

Attic是一个Python写的删除重复数据的备份程序,其主要目标是提供一种高效安全的数据备份方式。重复数据消除技术的使用使得Attic适用于日常备份,因为它可以只存储那些修改过的数据。

Attic特性

空间高效存储

可变块大小重复数据消除技术用于减少检测到的冗余数据存储字节数量。每个文件被分割成若干可变长度组块,只有那些从没见过的组合块会被压缩并添加到仓库中。

可选数据加密

所有数据可以使用256位AES加密进行保护,并使用HMAC-SHA256验证数据完整性和真实性。

离场备份

Attic可以通过SSH将数据存储到安装有Attic的远程主机上。

备份可作为文件系统挂载

备份归档可作为用户空间文件系统挂载,用于便捷地验证和恢复备份。

安装attic到ubuntu 14.10

打开终端并运行以下命令


  1. sudo apt-get install attic

使用Attic

手把手实例教学

在进行备份之前,首先要对仓库进行初始化:


  1. $ attic init /somewhere/my-repository.attic

将~/src和~/Documents目录备份到名为Monday的归档:


  1. $ attic create /somwhere/my-repository.attic::Monday ~/src ~/Documents

第二天创建一个新的名为Tuesday的归档:


  1. $ attic create --stats /somwhere/my-repository.attic::Tuesday ~/src ~/Documents

该备份将更快些,也更小些,因为只有之前从没见过的新数据会被存储。--stats选项会让Attic输出关于新创建的归档的统计数据,比如唯一数据(不和其它归档共享)的数量:


  1. 归档名:Tuesday
  2. 归档指纹:387a5e3f9b0e792e91ce87134b0f4bfe17677d9248cb5337f3fbf3a8e157942a
  3. 开始时间: Tue Mar 25 12:00:10 2014
  4. 结束时间: Tue Mar 25 12:00:10 2014
  5. 持续时间: 0.08 seconds
  6. 文件数量: 358
  7. 最初大小 压缩后大小 重复数据删除后大小
  8. 本归档: 57.16 MB 46.78 MB 151.67 kB
  9. 所有归档:114.02 MB 93.46 MB 44.81 MB

列出仓库中所有归档:


  1. $ attic list /somewhere/my-repository.attic
  2.  
  3. Monday Mon Mar 24 11:59:35 2014
  4. Tuesday Tue Mar 25 12:00:10 2014

列出Monday归档的内容:


  1. $ attic list /somewhere/my-repository.attic::Monday
  2.  
  3. drwxr-xr-x user group 0 Jan 06 15:22 home/user/Documents
  4. -rw-r--r-- user group 7961 Nov 17 2012 home/user/Documents/Important.doc

恢复Monday归档:


  1. $ attic extract /somwhere/my-repository.attic::Monday

通过手动删除Monday归档恢复磁盘空间:


  1. $ attic delete /somwhere/my-backup.attic::Monday

原文发布时间:2014-12-30

本文来自云栖合作伙伴“linux中国”

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Elasticsearch系列---数据建模实战
<p style="font-weight: 400; margin: 10px 0px; padding: 0px; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); max-width: 100%; line-height: 1.5; color: rgb(51, 51, 51); font-family: &quot;Helvetica Neue&quot;, Helvetica, &quot;PingFang SC&quot;, Tahoma, Arial, sans-serif; white-space: normal; backgroun
65 0
干货 | 论Elasticsearch数据建模的重要性
1、什么是数据模型? 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,用图形化的形式去描述业务规则的过程,从而表示现实世界中事务的相互关系的一种映射。
9 0
如何将不同类型数据导入Elaticsearch中?
题记 Elaticsearch的原理明白了以后,手头有很多不同类型的数据,如: 1)单条数据,如程序中自己构造的JSON格式数据; 2)符合Elasticsearch索引规范的批量数据; 3)日志文件,格式*.log; 4)结构化数据,存储在mysql、oracle等关系型数据库中; 5)非结构化数据,存储在mongo中; 如何将这些数据导入到Elasticsearch中呢?接下来,本文将逐个介绍。
5 0
Elasticsearch 跨集群数据迁移方案总结
Elasticsearch 跨集群数据迁移方案总结 -- elasticsearch-dump、reindex、snapshot、logstash
137 0
帆软FineReport如何使用程序数据集
大多数情况下,FineReport直接在设计器里使用“数据集查询”,直接写SQL就能满足报表要求,但对于一些复杂的报表,有时候SQL处理并不方便,这时可以把查询结果在应用层做一些预处理后,再传递给报表,即所谓的“程序数据集”,FineReport的帮助文档上给了一个示例: 1 package com.
1466 0
+关注
玄学酱
这个时候,玄酱是不是应该说点什么...
17436
文章
438
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载