分布式系统架构7：本地缓存-阿里云开发者社区

分布式系统架构7：本地缓存

2025-01-17 389

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 这是小卷关于分布式系统架构学习的第10篇文章，主要介绍本地缓存的基础理论。文章分析了引入缓存的利弊，解释了缓存对CPU和I/O压力的缓解作用，并讨论了缓存的吞吐量、命中率、淘汰策略等属性。同时，对比了几种常见的本地缓存工具（如ConcurrentHashMap、Ehcache、Guava Cache和Caffeine），详细介绍了它们的访问控制、淘汰策略及扩展功能。

这是小卷对分布式系统架构学习的第10篇文章，在开始学习分布式缓存之前，先来学习本地缓存的理论基础，了解为什么需要用缓存

1.引入缓存的影响

我们在开发时，用到缓存的情况，无非就是为了减少客户端对相同资源的重复请求，降低服务器的负载压力。引入缓存后，既有好处也有坏处

引入缓存负面影响：

开发角度，增加了系统复杂度，需考虑缓存失效、更新、一致性问题
运维角度，缓存会掩盖一些缺陷问题
安全角度，缓存可能泄密某些保密数据

引入缓存的理由：

为了缓解CPU压力，将实时计算运行结果存储起来，节省CPU压力
为了缓解I/O压力，将原本对网络、磁盘的访问改为对内存的访问

2.缓存的属性

选择缓存时，主要考虑吞吐量、命中率、扩展功能、分布式支持。前3个这篇文章会讲，下一篇再讲分布式缓存

2.1吞吐量

并发场景下，每秒操作数OPS，反映了缓存的工作效率

如Java8并发包的ConcurrentHashMap，线程安全实现原理是CAS+synchronized锁单个元素。但是该类仅有缓存功能，没有命中率、淘汰策略、缓存统计等功能

并发场景下，不可避免的会有读写数据带来的状态竞争问题，当前有2种处理套路：

以Guava Cache为代表的同步处理机制：在访问缓存数据时，一并完成缓存淘汰、统计、失效等状态变更操作，通过分段加锁等优化手段来尽量减少数据竞争。
以Caffeine为代表的异步日志提交机制：参考经典的数据库设计理论，把对数据的读、写过程看作是日志（即对数据的操作指令）的提交过程。

Caffeine使用了环形缓冲区来记录状态变动日志，为进一步减少数据竞争，Caffeine给每个线程都设置了专用的环形缓冲区，如下是Wikipedia上的环形缓冲示意：

本地缓存1.gif

环形缓冲区结构中，读取和写入是一起进行的，只要读取指针不落后于写指针一圈，这个操作可以永久进行下去，容纳无限多的新字符。

如果不满足，则必须阻塞写指针，等待读取清空缓冲区

2.2 命中率与淘汰策略

缓存的容量是有限的，也因此需要自动地实现淘汰低价值目标，也就是缓存淘汰策略

主要实现方案有三种：

第一种：FIFO（First In First Out）

即优先淘汰最早进入被缓存的数据。FIFO 的实现十分简单，但一般来说，越是频繁被用到的数据，往往越会早早地被存入缓存之中。

所以这种淘汰策略，很可能会大幅降低缓存的命中率

第二种：LRU（Least Recent Used）

即优先淘汰最久未被使用访问过的数据。LRU 通常会采用 HashMap 加 LinkedList 的双重结构（如 LinkedHashMap）来实现。每次缓存命中时，将命中对象调整到LinkedList的头部，每次淘汰从链表尾部清理

存在问题：如果热点数据一段时间没被访问，就会被淘汰；

第三种：LFU（Least Frequently Used）

优先淘汰最不经常使用的数据。LFU 会给每个数据添加一个访问计数器，每访问一次就加 1，当需要淘汰数据的时候，就清理计数器数值最小的那批数据。

缺点：每个数据都需要维护计数器，不便于处理随时间变化的热点数据

以上只是列了三种基础的淘汰策略，实际Caffeine 官方还制定了两种高级淘汰策略：ARC（Adaptive Replacement Cache）和LIRS（Low Inter-Reference Recency Set），更复杂的淘汰策略都是为了提高命中率的。

3.扩展功能

缓存不是只实现一个Map接口就可以的，还需要一些额外的功能，下面列出缓存的扩展功能：

加载器：从被动放入，变为主动通过加载器去加载指定 Key 值的数据
淘汰策略：支持用户根据需要自行选择淘汰策略
失效策略：缓存数据在超过一定时间内自动失效，Redis的策略是定时删除、定期删除、惰性删除
事件通知：提供事件监听器，在数据状态变动时进行一些额外操作
并发级别：如Guava Cache通过分段加锁来实现缓存的并发设置
容量控制：设置初始容量和最大容量
统计信息：命中率、平均加载时间、自动回收计数等信息
持久化：将缓存数据存储到数据库或者磁盘

4.本地缓存对比

	ConcurrentHashMap	Ehcache	Guava Cache	Caffeine
访问控制	最高	一般	良好	优秀（接近ConcurrentHashMap）
淘汰策略	无	多种：FIFO、LRU、LFU等	LRU	W-TinyLFU
扩展功能	无，只有基础访问接口	并发控制、失效策略、容量控制等	同左	同左

分布式系统架构7：本地缓存

1.引入缓存的影响

2.缓存的属性

2.1吞吐量

2.2 命中率与淘汰策略

3.扩展功能

4.本地缓存对比

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式系统架构7：本地缓存

1.引入缓存的影响

2.缓存的属性

2.1吞吐量

2.2 命中率与淘汰策略

3.扩展功能

4.本地缓存对比

热门文章

最新文章

相关课程

相关电子书