Redis数据持久化的两种方式

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
日志服务 SLS,月写入数据量 50GB 1个月
简介: Redis数据持久化的两种方式

Redis数据持久化

数据持久化主要是将内存中的数据写入disk。redis保存的数据在内存中,当redis发生宕机,那么存在redis中的数据就会消失,可能会导致数据丢失。那么如何解决这种问题呢?这就需要我们对redis中的数据进行持久化。


redis进行持久化的两种方法




+47.png
发生宕机时,数据恢复

+48.pngRDB

RDB(Redis DataBase)数据持久化是在指定时间将当前时刻内存中的数据生成一个 snapshot (快照,默认为dump.rdb),然后将快照保存到磁盘上,这样即使redis宕机了,下次可以通过将硬盘快照文件直接 读会到内存,达到恢复数据的效果。


在指定的时间间隔,执行数据集的时间点快照。

+49.png
配置文件(6 VS 7)

Redis6

+50.png
Redis7

+51.png
触发方式

自动触发

修改配置文件

vim /myredis/redis7.conf
# 5秒钟2次修改
save 5 2
# 修改dump文件保存路径,路径需要存在
dir /myredis/dumpfiles
# 修改dump文件名称
dbfilename dump6379.rdb

触发备份

# 执行上面的两个命令后,会再我们配置的 dir中生成 备份文件
set key1 value1 
set key2 value2

恢复备份

将备份文件 dump.rdb移动到 redis 安装目录下并启动服务即可


重要:


执行flushall、flushdb命令也会产生备份文件,但是备份文件为空。


redis服务器和备份必须分机隔离。防止物理机损坏后备份文件丢失。


手动触发

save

再主程序中执行会阻塞当前redis服务器,直到持久化工作完成。执行save命令期间,redis不能处理其他命令,线上禁止使用

+52.png
bgsave(默认)

redis会使用bgsave对当前内存中的所有数据做一份快照,这个操作是子进程再后台完成的,这允许主进程同时可以修改数据。

+53.png通过lastsave命令获取最后一次执行快照的时间

lastsave

优点

RDB是Redis数据的一个非常紧凑的单文件时间点表示。RDB文件非常适合备份。例如,可以在最近24小时内每小时归档一次RDB文件,并在30天内每天保存一个RDB快照,这可以在发生灾难时轻松恢复不同版本的数据集。

RDB非常适合灾难恢复,他可以传输到远程数据中心或云服务器上。

RDB最大限度的提高了Redis的性能,因为Redis父进程为了持久化而需要做的唯一工作就是派生一个将完成所有其余工作的子进程。父进程永远不会执行磁盘I/O或类似操作。

与AOF相比,RDB允许使用大数据集更快地重启

在副本上,RDB支持重启和故障转移后的部分重新同步。

总结


适合大规模的数据恢复

按照业务定时备份

对数据完整性和一致性要求不高

RDB文件在内存中的加载速度要比AOF快得多

缺点

如果您需要在Redis停止工作时(例如断电)将数据丢失的可能性降到最低,那么RDB并不好。您可以配置多个RDB的不同保存点。如果Redis由于任何原因在没有正确关闭的情况下停止工作,都会丢失最新分钟的数据

RDB需要经常fork()以便使用子进程在磁盘上持久化,如果数据集很大,fork()可能会消耗较多时间,并且如果数据集很大并且CPU性能不好,可能会导致Redis停止客户端服务几毫秒甚至一秒钟。AOF也需要fork()但是频率较低,可以调整要重写日志的频率,而不需要对持久性进行任何权衡。

总结


在一定间隔时间做一次备份,如果redis宕机,就会丢失当前至最近一次快照期间的数据

内存数据全量同步,如果数据量很大会导致I/O严重影响服务器性能。

RDB依赖于主进程的fork,在很大的数据集中会导致服务器瞬间延迟,fork()时内存中的数据被克隆了一份导致体积膨胀。

案例

数据丢失案例,模拟redis宕机


设置了 save 5 2,5 秒钟 2 次修改


①、正常写入

# 正常写入数据
set k1 v1
set k2 v2

+54.png
⑤、模拟宕机

# 写入k3
set k3 v3
# 查看redis进程
ps -ef|grep redis
# kill,模拟宕机
kill -9 3878

+55.png
⑤、重启redis

重启redis,发现 k3 数据丢失

+56.png修复dump.rdb文件

cd /usr/local/bin
redis-check-rdb /myredis/dumpfiles/dump6379.rdb

+57.png触发RDB快照

那些情况会触发RDB快照?

配置文件中默认的快照配置

手动save/bgsave命令

执行flushdb/flushall命令

执行shutdown且没有设置开启AOF持久化

主从复制时,主节点自动触发

禁用RDB

命令

redis-cli config set save ""

配置文件 redis.conf

# 配置文件设置下面内容
save ""

RDB优化配置项

配置文件 redis.conf

# 1.
save <seconds> <changes>
# 2.
dbfilename
# 3.
dir
# 4.默认yes,如果配置成no,表示你不在乎数据不一致或者有其他的手段发现和控制这种不一致,那么在快照写入失败时,也能确保redis继续接受新的写请求
stop-writes-on-bgsave-error
# 5.默认yes,对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩。如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能
rdbcompression
# 6.默认yes,在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能
rdbchecksum
# 7.在没有持久性的情况下删除复制中使用的RDB文件启用。默认情况下no,此选项是禁用的。
rdb-del-sync-files

AOF

AOF(Append Only File)数据持久化是记录每一次对redis的写操作命令(默认为appendonly.aof),当发生redis宕机时,将保存的操作命令重新再执行一次,从而达到恢复数据的效果。


以日志的形式来记录每个写操作,将redis执行过的写指令记录下来(读操作不记录),只允许追加文件不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前往后执行一次已完成数据恢复的工作。

+58.png默认redis没有开启AOF,需要手动设置 appendonly yes

工作流程

+59.png

编号

描述

1

Client作为命令的来源,会有多个源头以及源源不断的请求命令。

2

在这些命令到达Redis Server以后并不是直接写入AOF文件,会将其这些命令先放入APF缓存中进行保存。这里的AOF缓冲区实际上是内存中的一片区域,存在的目的是当这些命令达到一定量以后再写入磁盘,避免频繁的磁盘IO操作。

3

AOF缓冲会根据AOF缓冲区***同步文件的三种写回策略***将命令写入磁盘上的AOF文件。

4

随着写入的AOF内容的增加为避免文件膨胀。会根据规则进行命令的合并(又称AOF重写),从而起到AOF文件压缩的目的。

5

当Redis Server服务器重启的时候会从AOF文件载入数据。

三种写回策略

Always

同步写回,每个命令执行完立刻同步地将日志写回磁盘


everysec

每秒写回,每个命令执行完,只是先把日志写回到AOF文件的内存缓冲区,每隔一秒把缓冲区中的内容写入磁盘


no

操作系统控制的写回,每个命令执行完,只是先把日志写到AOF文件的内存缓冲区,由操作系统决定何时将缓冲区内容写回到磁盘


总结

配置项 写回时机 优点 缺点
Always 同步写回 可靠性高,数据基本不丢失 每个写命令都要落盘,性能影响较大
Everysec 每秒写回 性能适中 宕机时丢失1秒内的数据
No 操作系统控制的写回 性能好 宕机时丢失数据较多

配置文件(6 VS 7)

修改配置文件

开启aof

vim /myredis/redis7.conf
# 修改appendonly 为 yes
appendonly yes

使用默认的写回策略

# 每秒写回
sppendfsync everysec

aof文件保存路径

redis6: AOF保存文件位置和RDB保存文件位置一样,都是通过redis.conf配置文件中的 dir 配置

**redis7: ** 在redis7使用的的保存appendonly.aof文件的路径是 dir + appenddirname

# 修改之前配置的 dir /myredis/dumpfiles 为下面内容
dir /myredis
# 配置 appendonlydirname
appenddirname "appendonlydir"

aof文件保存名称


redis6: 有且仅有一个


redis7:


base基本文件


incr增量文件


manifest清单文件:


base : 基础AOF,它一般由子进程通过重写产生,该文件最多只有一个。


incr : 增量AOF,它一般会在AOF重写的开始执行时被创建,该文件可能存在多个。


history : 历史AOF,它由base和incr AOF变化而来,每次AOF重写成功完成时,本次AOF 重写之前对应的base和incr AOF都将变成history,history类型的AOF会被redis自动删除。


为了管理这些AOF文件,我们引入了一个manifest清单文件来跟踪、管理这些AOF。同时,为了便于AOF备份和拷贝,我们将所有的AOF文件和manifest文件放到一个单独的文件目录中,目录名由 appenddirname配置决定。


修复aof文件

redis-check-aof --fix appendonly.aof.1.incr.aof

优点

使用AOF Redis更加持久:您可以有不同的 fsyn 策略: 根本不fsync、每秒 fsync、每次查询时 fsync,使用每秒 fsync 的默认策略,写入性能仍然很棒。fsync 是使用后台线程执行的,当没有 fsync 正在进行时,主线程将努力执行写入,因此您只能丢失一秒钟的写入。

AOF 日志是一个仅附加日志,因此不会出现寻道问题,也不会在断电时出现损坏问题。即使由于某种原因(磁盘已满或其他原因) 日志以写一半的命令结尾,redis-check-aof 工具也能够轻松修复它

当AOF 变得太大时,Redis 能够在后台自动重写 AOF。重写是完全安全的,因为当 Redis 继续附加到旧文件时,会使用创建当前数据集所需的最少操作集生成一个全新的文件,一旦第二个文件准备就绪,Redis 就会切换两者并开始附加到新的那一个。

AOF 以易于理解和解析的格式依次包合所有操作的日志。您甚至可以轻松导出 AOF 文件。例如,即使您不小心使用该FLUSHALL命令刷新了所有内容,只要在此期间没有执行日志重写,您仍然可以通过停止服务器、删除最新命令并重新启动 Redis 来保存您的数据集.

总结


更好的保护数据不丢失、性能高、可做紧急恢复。


缺点

AOF 文件通常比相同数据集的等效 RDB 文件大。

根据确切的 fsync 策略,AOF 可能比 RDB 慢。一般来说,将fsync 设置为每秒性能仍然非常高,并且在禁用 fsync 的情况下,即使在高负载下它也应该与 RDB 一样快。即使在巨大的写入负载的情况下,RDB 仍然能够提供关于最大延迟的更多保证。

总结


相同数据集的数据而言aof文件要远大于rdb文件,恢复速度慢于rdb,aof运行效率要慢于rdb,每秒钟同步策略效率较好,不同步效率和rdb相同。


AOF重写机制

由于AOF持久化是Redis不断将写命令记录到 AOF 文件中,随着Redis不断的进行,AOF 的文件会越来越大,占用服务器内存越大以及 AOF 恢复要求时间越长。


为了解决这个问题,Redis新增了重写机制,当AOF文件的大小超过所设定的峰值时,Redis就会自动启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集或者手动使用命令 bgrewriteaof 来重写。


总结:启动AOF文件的内容压缩,只保留可恢复数据的最小指令集。


为什么需要重写?

set k1 v1
set k1 v3
set k1 v3
set k1 v4

上面的四条命令如果不重写,那么四条命令都将保存到 aof 文件中,不光占空间,在启动的时候需要一次执行四条命令,但是实际上我们只需要最后一条命令执行的效果即可。

开启重写后,只需要保留最后一条命令即可。

触发方式

自动触发

+60.png
根据上次重写后的aof大小,判断当前aof大小是不是增长了1倍

重写是满足的文件大小

两个条件同时满足才会触发


手动触发

客户端向服务器发送 bgrewriteaof 命令


AOF 文件的重写并不是对原文件进行重新整理,而是直接读取服务器中现有的键值对,然后用一条命令去代替之前记录这个键值对的多条命令,生成一个新的文件去替换原来的AOF文件。


案例

准备工作

# 开启 aof
appendonly yes
# 重写峰值,修改为 1k
auto-aof-rewrite-min-size 1k
# 关闭混合,修改为 no
aof-use-rdb-preamble no
# 删除之前全部的 aof和rdb(省略代码)

自动触发案例

启动redis服务,不断向写入内容,直到到达 1KB后,启动重写机制。

手动触发案例

# 发送命令
bgrewriteaof

重写原理

在重写开始前,redis会创建一个“重写子进程”,这个子进程会读取现有的AOF文件,并将其包含的指令进行分析压缩并写入到一个临时文件中。

与此同时,主进程会将新接收到的写指令一边累积到内存缓冲区中,一边继续写入到原有的AOF文件中,这样做是保证原有的AOF文件的可用性,避免在重写过程中出现意外。

当“重写子进程”完成重写工作后,它会给父进程发一个信号,父进程收到信号后就会将内存中缓存的写指令追加到新AOF文件中

当追加结束后,redis就会用新AOF文件来代替旧AOF文件,之后再有新的写指令,就都会追加到新的AOF文件中

重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似

RDB + AOF

RDB持久化方式能够在指定时间间隔能对数据进行快照存储


AOF持久化方式记录每次对服务器写操作,当服务器重启时 会自动执行这些命令来恢复原始数据,AOF命令以redis协议追加保存每次写操作到文件末尾。


RDB 与 AOF 可以共存,如果AOF 被开启会优先加载AOF文件来恢复原始的数据,因为在通常情况下AOF保存的数据集要比RDB文件保存的数据集要完整。


要不要只用AOF呢?


建议不要,因为RDB更适合用于备份数据库,AOF在不断的变化不好做备份。

+61.png

推荐方式

RDB + AOF混合

开启混合模式

aof-use-rdb-preamble的值为 yes

RDB + AOF混合


RDB镜像做全量持久化,AOF做增量持久化


先使用RDB进行快照存储,然后使用AOF持久化记录所有的写操作,当重写策略满足或手动触发重写的时候,将最新的数据存储为新的RDB记录。这样的话,重启服务的时候会从RDB和AOF两部分恢复数据,既保证了数据完整性,又提高了恢复数据的性能。简单来说:混合持久化方式产生的文件一部分是RDB格式,一部分是AOF格式。AOF包括了RDB头部+AOF混写


纯缓存

同时关闭 RDB + AOF


禁用RDB


禁用rdb持久化模式下,我们仍然可以使用命令 save、bgsave 生成 rdb 文件

save ""

禁用AOF

禁用aof持久化模式下,我们仍然可以使用命令 bgrewriteaof 生成aof 文件

appendonly no
相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
1月前
|
存储 缓存 NoSQL
数据的存储--Redis缓存存储(一)
数据的存储--Redis缓存存储(一)
|
8天前
|
NoSQL Redis
Redis的数据淘汰策略有哪些 ?
Redis 提供了 8 种数据淘汰策略,分为淘汰易失数据和淘汰全库数据两大类。易失数据淘汰策略包括:volatile-lru、volatile-lfu、volatile-ttl 和 volatile-random;全库数据淘汰策略包括:allkeys-lru、allkeys-lfu 和 allkeys-random。此外,还有 no-eviction 策略,禁止驱逐数据,当内存不足时新写入操作会报错。
42 16
|
29天前
|
监控 NoSQL Java
场景题:百万数据插入Redis有哪些实现方案?
场景题:百万数据插入Redis有哪些实现方案?
38 1
场景题:百万数据插入Redis有哪些实现方案?
|
1月前
|
存储 缓存 NoSQL
数据的存储--Redis缓存存储(二)
数据的存储--Redis缓存存储(二)
数据的存储--Redis缓存存储(二)
|
8天前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
在项目中,为了解决Redis与Mysql的数据一致性问题,我们采用了多种策略:对于低一致性要求的数据,不做特别处理;时效性数据通过设置缓存过期时间来减少不一致风险;高一致性但时效性要求不高的数据,利用MQ异步同步确保最终一致性;而对一致性和时效性都有高要求的数据,则采用分布式事务(如Seata TCC模式)来保障。
42 14
|
8天前
|
存储 NoSQL 算法
Redis分片集群中数据是怎么存储和读取的 ?
Redis集群采用哈希槽分区算法,共有16384个哈希槽,每个槽分配到不同的Redis节点上。数据操作时,通过CRC16算法对key计算并取模,确定其所属的槽和对应的节点,从而实现高效的数据存取。
35 13
|
8天前
|
存储 NoSQL Redis
Redis的数据过期策略有哪些 ?
Redis 采用两种过期键删除策略:惰性删除和定期删除。惰性删除在读取键时检查是否过期并删除,对 CPU 友好但可能积压大量过期键。定期删除则定时抽样检查并删除过期键,对内存更友好。默认每秒扫描 10 次,每次检查 20 个键,若超过 25% 过期则继续检查,单次最大执行时间 25ms。两者结合使用以平衡性能和资源占用。
30 11
|
9天前
|
监控 NoSQL 测试技术
【赵渝强老师】Redis的AOF数据持久化
Redis 是内存数据库,提供数据持久化功能,支持 RDB 和 AOF 两种方式。AOF 以日志形式记录每个写操作,支持定期重写以压缩文件。默认情况下,AOF 功能关闭,需在 `redis.conf` 中启用。通过 `info` 命令可监控 AOF 状态。AOF 重写功能可有效控制文件大小,避免性能下降。
|
9天前
|
存储 监控 NoSQL
【赵渝强老师】Redis的RDB数据持久化
Redis 是内存数据库,提供数据持久化功能以防止服务器进程退出导致数据丢失。Redis 支持 RDB 和 AOF 两种持久化方式,其中 RDB 是默认的持久化方式。RDB 通过在指定时间间隔内将内存中的数据快照写入磁盘,确保数据的安全性和恢复能力。RDB 持久化机制包括创建子进程、将数据写入临时文件并替换旧文件等步骤。优点包括适合大规模数据恢复和低数据完整性要求的场景,但也有数据完整性和一致性较低及备份时占用内存的缺点。
|
1月前
|
存储 缓存 NoSQL
大数据-45 Redis 持久化概念 RDB AOF机制 持久化原因和对比
大数据-45 Redis 持久化概念 RDB AOF机制 持久化原因和对比
39 2
大数据-45 Redis 持久化概念 RDB AOF机制 持久化原因和对比