当数据库成为瓶颈时,比如高并发、读多写少等场景,我们首先会想到的就是利用缓存来提高整个系统的性能。
缓存虽然能够大大提升整个系统的性能,但同时也引入了更多复杂性。
如果没有针对缓存进行比较好的处理,某些场景下甚至会导致整个系统崩溃。
这次我们要聊的就是:缓存热点
缓存热点
缓存热点是指大部分甚至所有的业务请求都命中同一份缓存数据。
虽然缓存本身的性能比较高,但对于一些特别热点的数据,如果大部分甚至所有的请求都命中同一份缓存数据,则这份数据所在的缓存服务器的压力也会很大。
比如,电商的爆品秒杀活动,短时间内被上千万的用户访问。
解决办法
缓存热点的常用解决方法有两种:复制多份缓存副本和本地内存缓存。接下来我们详细了解一下这两种方法:
复制多份缓存副本
复制多份缓存副本,就是将请求分散到多个缓存服务器上,减轻缓存热点导致的单台缓存服务器压力。
以爆品秒杀活动为例,爆品数据都可以生成 100 个缓存数据,缓存的数据是一样的,在缓存的 key 里面加上编号进行区分,每次读缓存时都随机读取其中某个缓存。
在设计缓存副本的时候,有一个细节需要注意:不同的缓存副本不要设置统一的过期时间,否则就会出现所有缓存副本同时生成同时失效的情况,从而引发缓存的雪崩效应。
正确的做法是设定一个过期时间范围,不同的缓存副本的过期时间是指定范围内的随机值。
本地内存缓存
把热点数据缓存在客户端的本地内存中,并且设置一个失效时间。对于每次读请求,将首先检查该数据是否存在于本地缓存中,如果存在则直接返回,如果不存在再去访问分布式缓存的服务器。
与复制多份缓存副本比较,本地内存缓存彻底“解放”了缓存服务器,不会对缓存服务器有任何压力。
不过,本地内存缓存也有自己的缺点,假如缓存服务器中数据被被更新了,本地内存缓存没有及时更新,就导致数据不一致的情况。
因此,本地内存缓存的失效时间需要设置尽量短一些。
热点缓存的发现
在前面的讨论中,我们预设了知道热点缓存有哪些,但是在大多数情况下,我们是无法知道哪些是热点缓存。
不过,我们可以使用以下方法及时发现热点缓存:
- 在客户端进行统计。在读取缓存时,加入数据统计的逻辑。当读取次数达到某个阈值时,判断其为热点缓存。
- 在Proxy层进行统计。当读取缓存时有Proxy层时,可以在Proxy层加入数据统计的逻辑。
- 使用缓存系统的自带工具。比如Redis性能分析工具redis-faina、redis-cli的hotkeys参数。
总结
缓存热点是指大部分甚至所有的业务请求都命中同一份缓存数据。
常用的解决方法有两种:复制多份缓存副本,每个副本过期时间设置为指定范围内的随机值;本地内存缓存,缓存失效时间尽量设置短一些。