Redis使用|缓存穿透,雪崩,击穿以及解决方案分析

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 前言作为一种非关系型数据库,redis也总是免不了有各种各样的问题,这篇文章主要是针对其中三个问题进行讲解:缓存穿透、缓存击穿和缓存雪崩,并给出一些解决方案。一. 什么是 缓存穿透缓存穿...

 image.gif

前言

作为一种非关系型数据库,redis也总是免不了有各种各样的问题,这篇文章主要是针对其中三个问题进行讲解:缓存穿透、缓存击穿和缓存雪崩,并给出一些解决方案。

一. 什么是 缓存穿透

缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就是漏洞。

小点的单机系统,基本上用postman就能搞死,比如我自己买的阿里云服务

网络异常,图片无法展示
|
image.gif

像这种你如果不对参数做校验,数据库id都是大于0的,我一直用小于0的参数去请求你,每次都能绕开Redis直接打到数据库,数据库也查不到,每次都这样,并发高点就容易崩掉了。

缓存穿透解决方案

有很多种方法可以有效地解决缓存穿透问题。

1.最常见的则是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被 这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。

2.另外也有一个更为简单粗暴的方法(我们采用的就是这种),如果一个查询返回的数据为空(不管是数 据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

二. 什么是 缓存雪崩

我了解的,目前电商首页以及热点数据都会去做缓存 ,一般缓存都是定时任务去刷新,或者是查不到之后去更新的,定时任务刷新就有一个问题。

举个简单的例子:如果所有首页的Key失效时间都是12小时,中午12点刷新的,我零点有个秒杀活动大量用户涌入,假设当时每秒 6000 个请求,本来缓存在可以扛住每秒 5000 个请求,但是缓存当时所有的Key都失效了。此时 1 秒 6000 个请求全部落数据库,数据库必然扛不住,它会报一下警,真实情况可能DBA都没反应过来就直接挂了。此时,如果没用什么特别的方案来处理这个故障,DBA 很着急,重启数据库,但是数据库立马又被新的流量给打死了。这就是我理解的缓存雪崩。

我刻意看了下我做过的项目感觉再吊的都不允许这么大的QPS直接打DB去,不过没慢SQL加上分库,大表分表可能还还算能顶,但是跟用了Redis的差距还是很大

网络异常,图片无法展示
|
image.gif

同一时间大面积失效,那一瞬间Redis跟没有一样,那这个数量级别的请求直接打到数据库几乎是灾难性的,你想想如果打挂的是一个用户服务的库,那其他依赖他的库所有的接口几乎都会报错,如果没做熔断等策略基本上就是瞬间挂一片的节奏,你怎么重启用户都会把你打挂,等你能重启的时候,用户早就睡觉去了,并且对你的产品失去了信心,什么垃圾产品。

缓存雪崩解决方案

处理缓存雪崩简单,在批量往Redis存数据的时候,把每个Key的失效时间都加个随机值就好了,这样可以保证数据不会在同一时间大面积失效了!

三. 什么是 缓存击穿

为什么把缓存击穿拿到最后说,因为它最复杂也最难处理,解决方案也有很多种,大家要仔细看哦!

出现缓存击穿有以下这些可能

    1. 这个跟缓存雪崩有点像,但是又有一点不一样,缓存雪崩是因为大面积的缓存失效,打崩了DB,而缓存击穿不同的是缓存击穿是指一个Key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个Key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个完好无损的桶上凿开了一个洞。
    2. 就是这个值是数据库新增的,但是缓存中暂时还没有,这个时候刚好并发请求进来了,如果处理不当也会发生

    缓存击穿解决方案

    我们的目标是:尽量少的线程构建缓存(甚至是一个) + 数据一致性 + 较少的潜在危险,下面会介绍四种方法来解决这个问题:

    1、使用互斥锁(mutex key)

    业界比较常用的做法,是使用mutex。简单地来说,就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db,而是先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX或者Memcache的ADD)去set一个mutex key,当操作返回成功时,再进行load db的操作并回设缓存;否则,就重试整个get缓存的方法。

      1. String get(String key) {  
      2.   String value = redis.get(key);  
      3.   if (value  == null) {  
      4.    if (redis.setnx(key_mutex, "1")) {  
      5.        // 3 min timeout to avoid mutex holder crash  
      6.        redis.expire(key_mutex, 3 * 60)  
      7.        value = db.get(key);  
      8.        redis.set(key, value);  
      9.        redis.delete(key_mutex);  
      10.    } else {  
      11.        //其他线程休息50毫秒后重试  
      12.        Thread.sleep(50);  
      13.        get(key);  
      14.    }  
      15.  }  
      16. }  

      2、"提前"使用互斥锁(mutex key):

      在value内部设置1个超时值(timeout1), timeout1比实际的memcache timeout(timeout2)小。当从cache读取到timeout1发现它已经过期时候,马上延长timeout1并重新设置到cache。然后再从数据库加载数据并设置到cache中。伪代码如下:

        1. v = rediscache.get(key);  
        2. if (v == null) {  
        3.    if (rediscache.setnx(key_mutex, 3 * 60 * 1000) == true) {  
        4.        value = db.get(key);  
        5.        rediscache.set(key, value);  
        6.        rediscache.delete(key_mutex);  
        7.    } else {  
        8.        sleep(50);  
        9.        retry();  
        10.    }  
        11. } else {  
        12.    if (v.timeout <= now()) {  
        13.        if (rediscache.setnx(key_mutex, 3 * 60 * 1000) == true) {  
        14.            // extend the timeout for other threads  
        15.            v.timeout += 3 * 60 * 1000;  
        16.            rediscache.set(key, v, KEY_TIMEOUT * 2);  
        17.  
        18.            // load the latest value from db  
        19.            v = db.get(key);  
        20.            v.timeout = KEY_TIMEOUT;  
        21.            rediscache.set(key, value, KEY_TIMEOUT * 2);  
        22.            rediscache.delete(key_mutex);  
        23.        } else {  
        24.            sleep(50);  
        25.            retry();  
        26.        }  
        27.    }  
        28. }  

        3、"永远不过期":

        这里的“永远不过期”包含两层意思:

        (1) 从redis上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是“物理”不过期。(2) 从功能上看,如果不过期,那不就成静态的了吗?所以我们把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存的构建,也就是“逻辑”过期

        从实战看,这种方法对于性能非常友好,唯一不足的就是构建缓存时候,其余线程(非构建缓存的线程)可能访问的是老数据,但是对于一般的互联网功能来说这个还是可以忍受。

          1. String get(final String key) {  
          2.        V v = redis.get(key);  
          3.        String value = v.getValue();  
          4.        long timeout = v.getTimeout();  
          5.        if (v.timeout <= System.currentTimeMillis()) {  
          6.            // 异步更新后台异常执行  
          7.            threadPool.execute(new Runnable() {  
          8.                public void run() {  
          9.                    String keyMutex = "mutex:" + key;  
          10.                    if (redis.setnx(keyMutex, "1")) {  
          11.                        // 3 min timeout to avoid mutex holder crash  
          12.                        redis.expire(keyMutex, 3 * 60);  
          13.                        String dbValue = db.get(key);  
          14.                        redis.set(key, dbValue);  
          15.                        redis.delete(keyMutex);  
          16.                    }  
          17.                }  
          18.            });  
          19.        }  
          20.        return value;  
          21.    }  

          4、资源保护:

          采用netflix的hystrix,可以做资源的隔离保护主线程池,如果把这个应用到缓存的构建也未尝不可。

          四种方案对比:

               作为一个并发量较大的互联网应用,我们的目标有3个:

               1. 加快用户访问速度,提高用户体验。

               2. 降低后端负载,保证系统平稳。

               3. 保证数据“尽可能”及时更新(要不要完全一致,取决于业务,而不是技术。)

               所以第二节中提到的四种方法,可以做如下比较,还是那就话:没有最好,只有最合适。

          解决方案 优点 缺点
          简单分布式锁(Tim yang)

           1. 思路简单

          2. 保证一致性

          1. 代码复杂度增大

          2. 存在死锁的风险

          3. 存在线程池阻塞的风险

          加另外一个过期时间(Tim yang)  1. 保证一致性 同上 
          不过期(本文)

          1. 异步构建缓存,不会阻塞线程池

          1. 不保证一致性。

          2. 代码复杂度增大(每个value都要维护一个timekey)。

          3. 占用一定的内存空间(每个value都要维护一个timekey)。

          资源隔离组件hystrix(本文)

          1. hystrix技术成熟,有效保证后端。

          2. hystrix监控强大。

          1. 部分访问存在降级策略。

          当然在请求刚进来的时候,也需要做好多处理:

          在接口层增加校验,比如用户鉴权校验,参数做校验,不合法的参数直接代码Return,比如:id 做基础校验,id <=0的直接拦截等。

          总结

          本文简单的介绍了,Redis的雪崩,击穿,穿透,三者其实都差不多,但是又有一些区别,在面试中其实这是问到缓存必问的,大家不要把三者搞混了,因为缓存雪崩、穿透和击穿,是缓存最大的问题,要么不出现,一旦出现就是致命性的问题,所以面试官一定会问你。

          大家一定要理解是怎么发生的,以及是怎么去避免的,发生之后又怎么去抢救,你可以不是知道很深入,但是你不能一点都不去想,面试有时候不一定是对知识面的拷问,或许是对你的态度的拷问,如果你思路清晰,然后知其然还知其所以然那就很赞,还知道怎么预防那肯定可以过五关斩六将。


          原文链接:https://mp.weixin.qq.com/s/lMyRI9FQi92DtapUa2BeIw#rd

          image.gif


          相关实践学习
          基于Redis实现在线游戏积分排行榜
          本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
          云数据库 Redis 版使用教程
          云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
          相关文章
          |
          6天前
          |
          缓存 NoSQL 关系型数据库
          大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
          本文详解缓存雪崩、缓存穿透、缓存并发及缓存预热等问题,提供高可用解决方案,帮助你在大厂面试和实际工作中应对这些常见并发场景。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
          大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
          |
          7天前
          |
          存储 缓存 NoSQL
          【赵渝强老师】基于Redis的旁路缓存架构
          本文介绍了引入缓存后的系统架构,通过缓存可以提升访问性能、降低网络拥堵、减轻服务负载和增强可扩展性。文中提供了相关图片和视频讲解,并讨论了数据库读写分离、分库分表等方法来减轻数据库压力。同时,文章也指出了缓存可能带来的复杂度增加、成本提高和数据一致性问题。
          【赵渝强老师】基于Redis的旁路缓存架构
          |
          16天前
          |
          缓存 NoSQL Redis
          Redis 缓存使用的实践
          《Redis缓存最佳实践指南》涵盖缓存更新策略、缓存击穿防护、大key处理和性能优化。包括Cache Aside Pattern、Write Through、分布式锁、大key拆分和批量操作等技术,帮助你在项目中高效使用Redis缓存。
          90 22
          |
          15天前
          |
          缓存 NoSQL 中间件
          redis高并发缓存中间件总结!
          本文档详细介绍了高并发缓存中间件Redis的原理、高级操作及其在电商架构中的应用。通过阿里云的角度,分析了Redis与架构的关系,并展示了无Redis和使用Redis缓存的架构图。文档还涵盖了Redis的基本特性、应用场景、安装部署步骤、配置文件详解、启动和关闭方法、systemctl管理脚本的生成以及日志警告处理等内容。适合初学者和有一定经验的技术人员参考学习。
          103 7
          |
          19天前
          |
          存储 缓存 监控
          利用 Redis 缓存特性避免缓存穿透的策略与方法
          【10月更文挑战第23天】通过以上对利用 Redis 缓存特性避免缓存穿透的详细阐述,我们对这一策略有了更深入的理解。在实际应用中,我们需要根据具体情况灵活运用这些方法,并结合其他技术手段,共同保障系统的稳定和高效运行。同时,要不断关注 Redis 缓存特性的发展和变化,及时调整策略,以应对不断出现的新挑战。
          53 10
          |
          19天前
          |
          缓存 监控 NoSQL
          Redis 缓存穿透的检测方法与分析
          【10月更文挑战第23天】通过以上对 Redis 缓存穿透检测方法的深入探讨,我们对如何及时发现和处理这一问题有了更全面的认识。在实际应用中,我们需要综合运用多种检测手段,并结合业务场景和实际情况进行分析,以确保能够准确、及时地检测到缓存穿透现象,并采取有效的措施加以解决。同时,要不断优化和改进检测方法,提高检测的准确性和效率,为系统的稳定运行提供有力保障。
          47 5
          |
          1月前
          |
          存储 缓存 NoSQL
          数据的存储--Redis缓存存储(一)
          数据的存储--Redis缓存存储(一)
          |
          1月前
          |
          存储 缓存 NoSQL
          数据的存储--Redis缓存存储(二)
          数据的存储--Redis缓存存储(二)
          数据的存储--Redis缓存存储(二)
          |
          1月前
          |
          消息中间件 缓存 NoSQL
          Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。
          【10月更文挑战第4天】Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。随着数据增长,有时需要将 Redis 数据导出以进行分析、备份或迁移。本文详细介绍几种导出方法:1)使用 Redis 命令与重定向;2)利用 Redis 的 RDB 和 AOF 持久化功能;3)借助第三方工具如 `redis-dump`。每种方法均附有示例代码,帮助你轻松完成数据导出任务。无论数据量大小,总有一款适合你。
          74 6
          |
          1月前
          |
          缓存 NoSQL 关系型数据库
          redis和缓存及相关问题和解决办法 什么是缓存预热、缓存穿透、缓存雪崩、缓存击穿
          本文深入探讨了Redis缓存的相关知识,包括缓存的概念、使用场景、可能出现的问题(缓存预热、缓存穿透、缓存雪崩、缓存击穿)及其解决方案。
          174 0
          redis和缓存及相关问题和解决办法 什么是缓存预热、缓存穿透、缓存雪崩、缓存击穿