Redis系列-6.Redis缓存双写一致性问题(上)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: Redis系列-6.Redis缓存双写一致性问题

缓存双写一致性问题


经典面试题引入


  • 你只要用缓存,就可能涉及到redis缓存与数据库双存储双写,你只要是双写,就一定会有数据一致性问题,那么如果解决一致性问题呢?
  • 双写一致性,先动缓存redis还是数据库mysql的那一个呢,why?
  • 延时双删你做过吗?会有哪些问题?
  • 有那么一种情况,微服务查询redis无mysql有,为了保证数据双写一致性回写redis你需要注意什么?双检加锁策略你了解吗?如何尽量避免缓存击穿呢?
  • redis和mysql双写100%会出纰漏,做不到强一致性,你如何保证最终一致性呢?


缓存双写一致性的理解


如何Redis中有数据:需要和数据库中的值相同


如何Redis中无数据:数据库中的值要是最新值,且准备回写Redis


缓存按照操作来细分两种:


如何写


多个线程同时去查询数据库的这条数据,那么我们可以在第一个查询数据的请求上使用一个 互斥锁来锁住它。


其他的线程走到这一步拿不到锁就等着,等第一个线程查询到了数据,然后做缓存。


后面的线程进来发现已经有缓存了,就直接走缓存。

@Service
@Slf4j
public class UserService {
    public static final String CACHE_KEY_USER = "user:";
    @Resource
    private UserMapper userMapper;
    @Resource
    private RedisTemplate redisTemplate;
    /**
     * 业务逻辑没有写错,对于小厂中厂(QPS《=1000)可以使用,但是大厂不行
     * @param id
     * @return
     */
    public User findUserById(Integer id)
    {
        User user = null;
        String key = CACHE_KEY_USER+id;
        //1 先从redis里面查询,如果有直接返回结果,如果没有再去查询mysql
        user = (User) redisTemplate.opsForValue().get(key);
        if(user == null)
        {
            //2 redis里面无,继续查询mysql
            user = userMapper.selectByPrimaryKey(id);
            if(user == null)
            {
                //3.1 redis+mysql 都无数据
                //你具体细化,防止多次穿透,我们业务规定,记录下导致穿透的这个key回写redis
                return user;
            }else{
                //3.2 mysql有,需要将数据写回redis,保证下一次的缓存命中率
                redisTemplate.opsForValue().set(key,user);
            }
        }
        return user;
    }
    /**
     * 加强补充,避免突然key失效了,打爆mysql,做一下预防,尽量不出现击穿的情况。
     * @param id
     * @return
     */
    public User findUserById2(Integer id)
    {
        User user = null;
        String key = CACHE_KEY_USER+id;
        //1 先从redis里面查询,如果有直接返回结果,如果没有再去查询mysql,
        // 第1次查询redis,加锁前
        user = (User) redisTemplate.opsForValue().get(key);
        if(user == null) {
            //2 大厂用,对于高QPS的优化,进来就先加锁,保证一个请求操作,让外面的redis等待一下,避免击穿mysql
            synchronized (UserService.class){
                //第2次查询redis,加锁后
                user = (User) redisTemplate.opsForValue().get(key);
                //3 二次查redis还是null,可以去查mysql了(mysql默认有数据)
                if (user == null) {
                    //4 查询mysql拿数据(mysql默认有数据)
                    user = userMapper.selectByPrimaryKey(id);
                    if (user == null) {
                        return null;
                    }else{
                        //5 mysql里面有数据的,需要回写redis,完成数据一致性的同步工作
                        redisTemplate.opsForValue().setIfAbsent(key,user,7L,TimeUnit.DAYS);
                    }
                }
            }
        }
        return user;
    }
}


数据库和缓存一致性的几种更新策略


目的


就是要达成最终一致性


给缓存设置过期时间,定期清理缓存并回写,是保证最终一致性的解决方案。


我们可以对存入缓存的数据设置过期时间,所有的写操作以数据库为准,对缓存操作只是尽最大努力即可。也就是说如果数据库写成功,缓存更新失败,那么只要到达过期时间,则后面的读请求自然会从数据库中读取新值然后回填缓存,达到一致性,切记,要以mysql的数据库写入库为准。


上述方案和后续落地案例是调研后的主流+成熟的做法,但是考虑到各个公司业务系统的差距,


不是100%绝对正确,不保证绝对适配全部情况,请自行酌情选择打法,合适自己的最好。


可以停机的情况


挂牌报错,凌晨升级,温馨提示,服务降级


单线程,这样重量级的数据操作最好不要多线程


但是一般互联网的业务不符合这种情况。


四种更新策略


先更新数据库,再更新缓存


异常问题1


1 先更新mysql的某商品的库存,当前商品的库存是100,更新为99个。

2 先更新mysql修改为99成功,然后更新redis。

3 此时假设异常出现,更新redis失败了,这导致mysql里面的库存是99而redis里面的还是100 。

4 上述发生,会让数据库里面和缓存redis里面数据不一致,读到redis脏数据


异常问题2


【先更新数据库,再更新缓存】,A、B两个线程发起调用


【正常逻辑】


1 A update mysql 100

2 A update redis 100

3 B update mysql 80

4 B update redis 80

=============================


【异常逻辑】多线程环境下,A、B两个线程有快有慢,有前有后有并行


1 A update mysql 100


3 B update mysql 80


4 B update redis 80


2 A update redis 100

=============================


最终结果,mysql和redis数据不一致,o(╥﹏╥)o,

mysql80,redis100


先更新缓存,再更新数据库


不太推荐,业务上一般把mysql作为底单数据库,保证最后解释


异常问题


【先更新缓存,再更新数据库】,A、B两个线程发起调用


【正常逻辑】

1 A update redis 100

2 A update mysql 100

3 B update redis 80

4 B update mysql 80

====================================


【异常逻辑】多线程环境下,A、B两个线程有快有慢有并行

A update redis 100

B update redis 80

B update mysql 80

A update mysql 100

----mysql100,redis80


先删除缓存,再更新数据库


异常问题


1 A线程先成功删除了redis里面的数据,然后去更新mysql,此时mysql正在更新中,还没有结束。(比如网络延时)


B突然出现要来读取缓存数据。

2 此时redis里面的数据是空的,B线程来读取,先去读redis里数据(已经被A线程delete掉了),此处出来2个问题:


2.1 B从mysql获得了旧值

B线程发现redis里没有(缓存缺失)马上去mysql里面读取,从数据库里面读取来的是旧值。


2.2 B会把获得的旧值写回redis

获得旧值数据后返回前台并回写进redis(刚被A线程删除的旧数据有极大可能又被写回了)。

3 A线程更新完mysql,发现redis里面的缓存是脏数据,A线程直接懵逼了,o(╥﹏╥)o


两个并发操作,一个是更新操作,另一个是查询操作,


A删除缓存后,B查询操作没有命中缓存,B先把老数据读出来后放到缓存中,然后A更新操作更新了数据库。


于是,在缓存中的数据还是老的数据,导致缓存中的数据是脏的,而且还一直这样脏下去了。


4 总结流程:


(1)请求A进行写操作,删除redis缓存后,工作正在进行中,更新mysql…A还么有彻底更新完mysql,还没commit


(2)请求B开工查询,查询redis发现缓存不存在(被A从redis中删除了)


(3)请求B继续,去数据库查询得到了mysql中的旧值(A还没有更新完)


(4)请求B将旧值写回redis缓存


(5)请求A将新值写入mysql数据库


上述情况就会导致不一致的情形出现。

时间 线程A 线程B 出现的问题
t1 请求A进行写操作,删除缓存成功后,工作正在mysql进行中…

t2


1 缓存中读取不到,立刻读mysql,由于A还没有对mysql更新完,读到的是旧值 2 还把从mysql读取的旧值,写回了redis

1 A还没有更新完mysql,导致B读到了旧值 2 线程B遵守回写机制,把旧值写回redis,导致其它请求读取的还是旧值,A白干了。

t3

A更新完mysql数据库的值,over


redis是被B写回的旧值, mysql是被A更新的新值。出现了,数据不一致问题。

总结一下:

先删除缓存,再更新数据库 如果数据库更新失败或超时或返回不及时,导致B线程请求访问缓存时发现redis里面没数据,缓存缺失,B再去读取mysql时,从数据库中读取到旧值,还写回redis,导致A白干了,o(╥﹏╥)o

解决方案


采用延时双删策略

延迟双删常见问题


线程A sleep的时间,就需要大于线程B读取数据再写入缓存的时间。


这个时间怎么确定呢?


第一种方法:


在业务程序运行的时候,统计下线程读数据和写缓存的操作时间,自行评估自己的项目的读数据业务逻辑的耗时,


以此为基础来进行估算。然后写数据的休眠时间则在读数据业务逻辑的耗时基础上加百毫秒即可。


这么做的目的,就是确保读请求结束,写请求可以删除读请求造成的缓存脏数据。


第二种方法:


新启动一个后台监控程序,比如后面要讲解的WatchDog监控程序,会加时


但是这种同步淘汰策略,吞吐量降低了怎么办?

启动一个异步线程,等更新完mysql之后,返回一个标志位或者我去监控你,知道你已经完成了mysql的更新操作,马上回去二次删除,这样就不用沉睡一段时间,就没有sleep(20)这句话了,直接启动一个异步线程,这样不就可以加大吞吐量了。


先更新数据库,再删除缓存


异常问题

时间 线程A 线程B 出现的问题
t1 更新数据库中的值…
t2 缓存中立刻命中,此时B读取的是缓存旧值。 A还没有来得及删除缓存的值,导致B缓存命中读到旧值。
t3 更新缓存的数据,over


先更新数据库,再删除缓存 假如缓存删除失败或者来不及,导致请求再次访问redis时缓存命中,读取到的是缓存旧值。

业务指导思想


阿里巴巴Canal也是类似的思想


上述的订阅binlog程序在mysql中有现成的中间件叫canal,可以完成订阅binlog日志的功能。


解决方案

1 可以把要删除的缓存值或者是要更新的数据库值暂存到消息队列中(例如使用Kafka/RabbitMQ等)。


2 当程序没有能够成功地删除缓存值或者是更新数据库值时,可以从消息队列中重新读取这些值,然后再次进行删除或更新。


3 如果能够成功地删除或更新,我们就要把这些值从消息队列中去除,以免重复操作,此时,我们也可以保证数据库和缓存的数据一致了,否则还需要再次进行重试


4 如果重试超过的一定次数后还是没有成功,我们就需要向业务层发送报错信息了,通知运维人员。


权威答案


类似经典的分布式事务问题,只有一个权威答案:最终一致性


  • 流量充值,先下发短信实际充值可能滞后5分钟,可以接受
  • 电商发货,短信下发但是物流明天见


总结


在大多数业务场景下,


个人建议优先使用先更新数据库,再删除缓存的方案(先更库→后删存)。理由如下:


1 先删除缓存值再更新数据库,有可能导致请求因缓存缺失而访问数据库,给数据库带来压力导致打满mysql。


2 如果业务应用中读取数据库和写缓存的时间不好估算,那么,延迟双删中的等待时间就不好设置。


多补充一句:如果使用先更新数据库,再删除缓存的方案


如果业务层要求必须读取一致性的数据,那么我们就需要在更新数据库时,先在Redis缓存客户端暂停并发读请求,等数据库更新完、缓存值删除后,再读取数据,从而保证数据一致性,这是理论可以达到的效果,但实际,不推荐,因为真实生产环境中,分布式下很难做到实时一致性,一般都是最终一致性,请大家参考。

策略 高并发多线程条件下 问题 现象 解决方案
先删除redis缓存,再更新mysql 缓存删除成功但数据库更新失败 Java程序从数据库中读到旧值 再次更新数据库,重试

缓存删除成功但数据库更新中…有并发读请求 并发请求从数据库读到旧值并回写到redis,导致后续都是从redis读取到旧值 延迟双删
先更新mysql,再删除redis缓存 数据库更新成功,但缓存删除失败 Java程序从redis中读到旧值 再次删除缓存,重试
数据库更新成功但缓存删除中…有并发读请求 并发请求从缓存读到旧值 等待redis删除完成,这段时间有



Redis系列-6.Redis缓存双写一致性问题(下):https://developer.aliyun.com/article/1414662

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
18天前
|
缓存 NoSQL 关系型数据库
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
本文详解缓存雪崩、缓存穿透、缓存并发及缓存预热等问题,提供高可用解决方案,帮助你在大厂面试和实际工作中应对这些常见并发场景。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
|
19天前
|
存储 缓存 NoSQL
【赵渝强老师】基于Redis的旁路缓存架构
本文介绍了引入缓存后的系统架构,通过缓存可以提升访问性能、降低网络拥堵、减轻服务负载和增强可扩展性。文中提供了相关图片和视频讲解,并讨论了数据库读写分离、分库分表等方法来减轻数据库压力。同时,文章也指出了缓存可能带来的复杂度增加、成本提高和数据一致性问题。
【赵渝强老师】基于Redis的旁路缓存架构
|
12天前
|
缓存 NoSQL PHP
Redis作为PHP缓存解决方案的优势、实现方式及注意事项。Redis凭借其高性能、丰富的数据结构、数据持久化和分布式支持等特点,在提升应用响应速度和处理能力方面表现突出
本文深入探讨了Redis作为PHP缓存解决方案的优势、实现方式及注意事项。Redis凭借其高性能、丰富的数据结构、数据持久化和分布式支持等特点,在提升应用响应速度和处理能力方面表现突出。文章还介绍了Redis在页面缓存、数据缓存和会话缓存等应用场景中的使用,并强调了缓存数据一致性、过期时间设置、容量控制和安全问题的重要性。
33 5
|
27天前
|
缓存 NoSQL Redis
Redis 缓存使用的实践
《Redis缓存最佳实践指南》涵盖缓存更新策略、缓存击穿防护、大key处理和性能优化。包括Cache Aside Pattern、Write Through、分布式锁、大key拆分和批量操作等技术,帮助你在项目中高效使用Redis缓存。
152 22
|
26天前
|
缓存 NoSQL 中间件
redis高并发缓存中间件总结!
本文档详细介绍了高并发缓存中间件Redis的原理、高级操作及其在电商架构中的应用。通过阿里云的角度,分析了Redis与架构的关系,并展示了无Redis和使用Redis缓存的架构图。文档还涵盖了Redis的基本特性、应用场景、安装部署步骤、配置文件详解、启动和关闭方法、systemctl管理脚本的生成以及日志警告处理等内容。适合初学者和有一定经验的技术人员参考学习。
130 7
|
27天前
|
缓存 NoSQL 关系型数据库
mysql和缓存一致性问题
本文介绍了五种常见的MySQL与Redis数据同步方法:1. 双写一致性,2. 延迟双删策略,3. 订阅发布模式(使用消息队列),4. 基于事件的缓存更新,5. 缓存预热。每种方法的实现步骤、优缺点均有详细说明。
|
2月前
|
存储 缓存 NoSQL
数据的存储--Redis缓存存储(一)
数据的存储--Redis缓存存储(一)
|
2月前
|
存储 缓存 NoSQL
数据的存储--Redis缓存存储(二)
数据的存储--Redis缓存存储(二)
数据的存储--Redis缓存存储(二)
|
2月前
|
消息中间件 缓存 NoSQL
Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。
【10月更文挑战第4天】Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。随着数据增长,有时需要将 Redis 数据导出以进行分析、备份或迁移。本文详细介绍几种导出方法:1)使用 Redis 命令与重定向;2)利用 Redis 的 RDB 和 AOF 持久化功能;3)借助第三方工具如 `redis-dump`。每种方法均附有示例代码,帮助你轻松完成数据导出任务。无论数据量大小,总有一款适合你。
78 6
|
2月前
|
缓存 NoSQL 关系型数据库
redis和缓存及相关问题和解决办法 什么是缓存预热、缓存穿透、缓存雪崩、缓存击穿
本文深入探讨了Redis缓存的相关知识,包括缓存的概念、使用场景、可能出现的问题(缓存预热、缓存穿透、缓存雪崩、缓存击穿)及其解决方案。
188 0
redis和缓存及相关问题和解决办法 什么是缓存预热、缓存穿透、缓存雪崩、缓存击穿