写在前面
由于Redis的数据都存放在内存中,如果没有配置持久化,redis重启后数据就全丢失了,于是需要开启redis的持久化功能,将数据保存到磁盘上,当redis重启后,可以从磁盘中恢复数据。 redis提供两种方式进行持久化,一种是RDB持久化(原理是将Reids在内存中的数据库记录定时dump到磁盘上的RDB持久化),另外一种是AOF持久化(原理是将Reids的操作日志以追加的方式写入文件)。 那么这两种持久化方式有什么区别呢,改如何选择呢?网上看了大多数都是介绍这两种方式怎么配置,怎么使用,就是没有介绍二者的区别,在什么应用场景下使用。
AOF
AOF持久化以日志的形式记录服务器所处理的每一个写、删除操作,查询操作不会记录,以文本的方式记录,可以打开文件看到详细的操作记录。
- aof 是写命令追加到持久化文件的方式。
- aof 支持几种持久化策略,其中每秒数据增量存盘一次效率比较高。
- aof 支持 rdb 混合型存储(需要重写处理)。
- aof 一定程度上记录了 redis 的写操作流水,一段时间内文件冗余数据比较大需要重写解决问题。
优点
- 弥补了RDB的数据误差的缺点,因为每次操作都会以日志的形式追加,不会出现数据不一致,不准确的情况
- 如果日志过大,Redis可以自动启用rewrite机制
缺点
- 如果选择每次更新都同步到持久化文件上,则执行效率没有RDB那么高
- 因为每次操作或者每秒钟都同步到持久化文件上,则持久化文件占用的空间会比较大
RDB
RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘,实际操作过程是fork一个子进程,先将数据集写入临时文件,写入成功后,再替换之前的文件,用二进制压缩存储
- rdb 快照,一个时间点的 redis 内存数据全盘落地(快照)。
- rdb 文件是二进制数据压缩文件,数据落地速度快(相对),体积小。
- 因为 redis 内存是全部数据落地,操作频率不能太高,通过配置持久化频率,几分钟到几小时不等。
优点
- 因为是定时备份的(可以设置每隔多少秒,有多少个key发生变化进行备份)。在数据恢复的时候数据可以快速完整恢复数据
- 对于灾难恢复而言,因为我们可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上。
- 因为是子进程进行备份,并不会影响到服务器进程,对服务器性能影响少。
- 相比于AOF机制,如果数据集很大,RDB的启动效率会更高,因为AOF是以追加的形式记录操作,类似于日志,所以文件比较大
缺点
- 如果数据量很大,每次到了定时备份的时候,那么在备份的时候子进程占用的cpu以及io开销会比较大,
- 如果备份的时候主进程有数据更新,那么更新的这部分数据不会被备份,从而导致数据准确性上有一定机会产生误差
使用场景
根据 aof 和 rdb 持久化特点,我们看看应用场景主要区别:
- 数据恢复
redis 服务异常,aof 比 rdb 更有利于数据恢复。aof 默认每秒将数据增量追加到文件末存盘一次,rdb 是一个时间点的数据快照,时间跨度比较大。 - 数据备份
rdb 是 redis 内存数据快照,速度快,体积小。更适合于数据备份存储。 - redis 服务启动速度
redis 启动加载 rdb 文件 比 aof 快。 因为 aof 文件有冗余命令,rdb 是数据集合。 - 持久化速度
aof 默认每秒存盘和 rdb 持久化都是异步存储,基本不影响主线程主逻辑功能。如果 aof 采用写命令实时存盘,将会严重影响 redis 服务性能。 - 集群节点间全量同步
集群节点间数据全量同步,需要拷贝服务进程的内存数据,根据 rdb 持久化特点:速度快,体积小,显然 rdb 更适合于集群间数据传输。
持久化配置
AOF
还是在redis.conf中找属性appendonly 该属性
appendonly yes 复制代码
如上图所示,这样就开启AOF机制的持久化了,AOF持久化默认是关闭的,redis默认是开启RDB持久化的。生产环境中一般AOF还是要开启的,除非可以容忍出现故障,可以丢失几分钟的数据。
打开AOF之后,redis每次接收到一个命令之后,就会写入日志文件中,当然先是写入os cache中,然后每隔一定时间再fsync一下。而且即使AOF和RDB都开启,在redis重启之后,也是会优先通过AOF进行数据恢复,因为AOF日志文件中的数据比较完整。
AOF的fsync的策略配置:
always: 每次写入一条数据,就立即将这个数据对应的写日志fsync到磁盘上去,性能非常的差,吞吐量非常低,如果非要保证redis不能丢失数据,那就只能这样子了。
everysec: 每秒将os cache中的数据fsync到磁盘,这个最常用,并且redis默认也是这个策略,生产环境一般也是这么配置,性能也很高,QPS可达到上万。
no: 仅仅将数据刷入到os cache中就不管了,然后就只能靠os cache自己的刷盘策略,时不时的将os cache中的数据刷入磁盘。
RDB
#设置60秒修改5个值就会保存rdb文件 save 60 5