Rsync 笔记(一)

简介: rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。

Rsync 笔记(一)

简介

rsync是一个开源 实用程序,提供快速增量文件传输。rsync可以在GNU通用公共许可证下免费获得,目前由Wayne Davison维护。

rsync(remote sync)是类unix系统下的数据镜像备份工具。它的特性如下:

  • 可以镜像保存整个目录树和文件系统。
  • 可以很容易做到保持原来文件的权限、时间、软硬链接等等。
  • 无须特殊权限即可安装。
  • 快速:第一次同步时 rsync 会复制全部内容,但在下一次只传输修改过的文件。rsync 在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的带宽。
  • 安全:可以使用scp、ssh等方式来传输文件,当然也可以通过直接的socket连接。
  • 支持匿名传输,以方便进行网站镜象。

安装配置

linux下服务器端与客户端是同一个软件
yum -y install rsync
默认安装在/usr/bin/rsync
rsync --help 或者 man rsync //查看帮助文

linux下客户端配置

客户端只需要配置一个密码文件即可。该密码文件中的密码要与rsync服务器上的密码文件中的密码对应,并且也要与rsync服务器rsyncd.conf配置文件中的认证模块中的用户匹配。

密码文件中,只需要写入密码即可,不需要用户名。(服务器端密码文件需要写入 用户名:密码)
密码文件创建完毕后,要把其权限设置为600

linux下服务器端配置

服务器端需要启动服务,才能随时以daemon认证方式同步文件。客户端可以接收文件时才启动。

  1. 修改rsync配置文件
uid = root
gid = root
user chroot = no
max connections = 200
timeout = 600
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsyncd.lock
log file = /var/run/rsyncd.log
[backup]
path = /home/rsync/
ignore errors
read only = no
list = no
hosts allow = 192.168.213.0/255.255.255.0
auth users = test
secrets file = /etc/rsyncd.password
  1. 修改rsync用户与对应密码文件
    添加如下行:

test:test
上述为用户test,密码test(用户在前面)

注意:该密码文件中的用户和密码可以进行自定义,同时该用户不一定要在服务器中的系统用户存在。一个rsync配置文件中可以包含多个认证模块,同时一个密码文件中也可以存放多个用户和其对应的密码。其中每一个认证模块可以对应不同的客户端。

核心算法

假定在名为 α 和 β 的两台计算机之间同步相似的文件 A 与 B,其中 α 对文件A拥有访问权,β 对文件 B 拥有访问权。并且假定主机 α 与 β 之间的网络带宽很小。那么 Rsync 算法将通过下面的五个步骤来完成:

  1. β 将文件 B 分割成一组不重叠的固定大小为 S 字节的数据块。最后一块可能会比 S 小。
  2. β 对每一个分割好的数据块执行两种校验:一种是32位的滚动弱校验,另一种是128位的 MD4 强校验。
  3. β 将这些校验结果发给 α。
  4. α 通过搜索文件 A 的所有大小为 S 的数据块(偏移量可以任选,不一定非要是 S 的倍数),来寻找与文件B 的某一块有着相同的弱校验码和强校验码的数据块。这项工作可以借助滚动校验的特性很快完成。
  5. α 发给 β 一串指令来生成文件 A 在 β 上的备份。这里的每一条指令要么是对文件 B 经拥有某一个数据块而不须重传的证明,要么是一个数据块,这个数据块肯定是没有与文件 B 的任何一个数据块匹配上的。

用法实例

rsync [OPTION]... SRC DEST
rsync [OPTION]... SRC [USER@]host:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
rsync [OPTION]... [USER@]HOST::SRC DEST
rsync [OPTION]... SRC [USER@]HOST::DEST
rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]

The ':' usages connect via remote shell, while '::' & 'rsync://' usages connect to an rsync daemon, and require SRC or DEST to start with a module name.

对应于以上六种命令格式,rsync有六种不同的工作模式:

  1. 拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:rsync -a /data /backup
  2. 使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。当DST路径地址包含单个冒号":"分隔符时启动该模式。如:rsync -avz *.c foo:src
  3. 使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。当SRC地址路径包含单个冒号":"分隔符时启动该模式。如:rsync -avz foo:src/bar /data
  4. 从远程rsync服务器中拷贝文件到本地机。当SRC路径信息包含"::"分隔符时启动该模式。如:rsync -av root@192.168.78.192::www /databack
  5. 从本地机器拷贝文件到远程rsync服务器中。当DST路径信息包含"::"分隔符时启动该模式。如:rsync -av /databack root@192.168.78.192::www
  6. 列远程机的文件列表。这类似于rsync传输,不过只要在命令中省略掉本地机信息即可。如:rsync -v rsync://192.168.78.192/www

也可以不使用远程shell传输。在这种情况下,可以直接连接到远程rsync daemon,通常使用TCP端口873.需要守护程序在远程系统上运行。以这种方式使用rsync与将其与远程shell的区别:

  • 您可以使用双冒号 :: 而不是单个冒号来将主机名与路径分开,或者使用rsync://URL
  • "path"的第一个单词实际上是一个模块名称。
  • 远程守护程序可能会在您连接时打印当天的消息。
  • 如果在远程守护程序上未指定路径名,则将显示守护程序上的可访问路径列表。
  • 如果未指定本地目标,则会提供远程守护程序上指定文件的列表。
  • 您不能指定--rsh(-e)选项。

复制名为“src”的远程模块中的所有文件的示例:

rsync -av host::src /dest

远程守护程序上的某些模块可能需要身份验证。如果是这样,您将在连接时收到密码提示。您可以通过将环境变量RSYNC_PASSWORD设置为要使用的密码或使用--password-file选项来避免密码提示。在编写rsync脚本时,这可能很有用。

注意事项

注意尾随下划,源上的尾部斜杠更改此行为以避免在目标上创建其他目录级别。

创建一个有着 "source"内容的 "destination/source"目录,命令:
rsync -r source/ destination

把"source/"目录下的所有文件全部复制到"destination"目录下,而没有中间的子目录:
rsync -r source/. destination

以下每个命令都以相同的方式复制文件,包括它们对/dest/foo属性的设置:

rsync -av /src/foo /dest
rsync -av /src/foo/ /dest/foo

主机和模块引用不需要使用尾部斜杠,默认就是复制目录的内容:

rsync -av host: /dest
rsync -av host::module /dest

通过省略模块名称列出特定rsync守护程序中可用的所有(可列表)模块:

rsync somehost.mydomain.com::

rsync命令参数

-v, --verbose          详细模式输出。
-q, --quiet            精简输出模式。
-c, --checksum         打开校验开关,强制对文件传输进行校验。
-a, --archive          归档模式,表示以递归方式传输文件,并保持所有文件属性,等于 -rlptgoD。
-r, --recursive        对子目录以递归模式处理。
-R, --relative         使用相对路径信息。
-b, --backup           创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为 ~filename。可以使用 --suffix 选项来指定不同的备份文件前缀。
--backup-dir           将备份文件(~filename)存放在在目录下。
-suffix=SUFFIX         定义备份文件前缀。
-u, --update           仅仅进行更新,也就是跳过所有已经存在于 DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件。)
-l, --links            保留软链结。
-L, --copy-links       想对待常规文件一样处理软链结。
--copy-unsafe-links    仅仅拷贝指向 SRC 路径目录树以外的链结。
--safe-links           忽略指向 SRC 路径目录树以外的链结。
-H, --hard-links       保留硬链结。
-p, --perms            保持文件权限。
-o, --owner            保持文件属主信息。
-g, --group            保持文件属组信息。
-D, --devices          保持设备文件信息。
-t, --times            保持文件时间信息。
-S, --sparse           对稀疏文件进行特殊处理以节省 DST 的空间。
-n, --dry-run          显示哪些文件将被传输(新增、修改和删除)。
-W, --whole-file       拷贝文件,不进行增量检测。
-x, --one-file-system  不要跨越文件系统边界。
-B, --block-size=SIZE  检验算法使用的块尺寸,默认是 700 字节。
-e, --rsh=COMMAND      指定使用 rsh, ssh 方式进行数据同步。
--rsync-path=PATH      指定远程服务器上的 rsync 命令所在路径信息。
-C, --cvs-exclude      使用和 CVS 一样的方法自动忽略文件,用来排除那些不希望传输的文件。
--existing             仅仅更新那些已经存在于 DST 的文件,而不备份那些新创建的文件。
--delete               删除那些 DST 中 SRC 没有的文件。
--delete-excluded      同样删除接收端那些被该选项指定排除的文件。
--delete-after         传输结束以后再删除。
--ignore-errors        即使出现 IO 错误也进行删除。
--max-delete=NUM       最多删除 NUM 个文件。
--partial              保留那些因故没有完全传输的文件,以便实现断点续传。
--force                强制删除目录,即使不为空。
--numeric-ids          不将数字的用户和组 ID 匹配为用户名和组名。
--timeout=TIME         IP 超时时间,单位为秒。
-I, --ignore-times     不跳过那些有同样的时间和长度的文件。
--size-only            当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间。
--modify-window=NUM    决定文件是否时间相同时使用的时间戳窗口,默认为 0。
-T --temp-dir=DIR      在 DIR 中创建临时文件。
--compare-dest=DIR     同样比较 DIR 中的文件来决定是否需要备份。
--progress             显示传输过程。
-P                     等同于 -partial -progress。
-z, --compress         对备份的文件在传输时进行压缩处理。
--exclude=PATTERN      指定排除不需要传输的文件模式。
--include=PATTERN      指定不排除而需要传输的文件模式。
--exclude-from=FILE    排除 FILE 中指定模式的文件。
--include-from=FILE    不排除 FILE 指定模式匹配的文件。
--version              打印版本信息。
--address              绑定到特定的地址。
--config=FILE          指定其他的配置文件,不使用默认的 rsyncd.conf 文件。
--port=PORT            指定其他的 rsync 服务端口。
--blocking-io          对远程 shell 使用阻塞 IO。
--stats                给出某些文件的传输状态。
--log-format=formAT    指定日志文件格式。
--password-file=FILE   从 FILE 中得到密码。
--bwlimit=KBPS         限制 I/O 带宽,KBytes per second。
-h, --help             显示帮助信息。

参考文档

rsync命令
rsync官网

相关文章
|
1月前
|
运维 监控 Linux
Linux Rsync服务详解(二)——Rsync服务实战
Linux Rsync服务详解(二)——Rsync服务实战
18 1
|
3月前
|
网络协议 Linux Shell
Linux命令(122)之rsync
Linux命令(122)之rsync
33 6
|
数据安全/隐私保护 Linux 网络安全
|
分布式计算 安全 Hadoop
rsync 案例|学习笔记
快速学习 rsync 案例
|
数据安全/隐私保护 Linux 网络安全
学习笔记:rsync命令实战
rsync是Linux系统下的数据镜像备份工具,本章就会以实例具体介绍如何使用rsync命令。
1609 0
|
数据安全/隐私保护 开发工具 Perl
|
数据安全/隐私保护 网络协议 算法