10 分钟搞懂缓存设计策略

简介: 10 分钟搞懂缓存设计策略

在设计缓存系统时需要考虑不同缓存策略的优缺点和适用场景,通过了解和应用这些策略,可以优化缓存系统的性能和效率。原文: 6-Caching Strategies to Remember while designing Cache System

前言

缓存的目标是减少从原始数据源获取数据的次数,从而加快处理速度并减少延迟。


缓存可以在不同体系架构级别上实现,包括内存缓存、磁盘缓存、数据库缓存和 CDN 缓存。


可以用不同的技术缓存数据,每种技术都有其优缺点。比如内存缓存将数据存储在计算机主内存中,与磁盘缓存相比,可以实现更快的访问速度。


另一方面,磁盘缓存将数据存储在硬盘上,速度比内存慢,但相对访问远程数据源的速度还是要快得多。


使用数据库缓存,将频繁访问的数据存储在数据库中,从而减少从外部存储检索数据的需要。


最后,CDN 缓存将数据存储在分布式服务网络中,从而减少访问远程数据的时延。



目录

  1. 缓存系统关键性能指标
  2. 读密集型应用缓存
  3. 写密集型应用缓存
  4. 缓存失效方法
  5. 结论



缓存系统关键性能指标

为了提高缓存系统的效率和性能,非常重要的一点是需要监控各种指标,从而根据指标做出有关缓存系统的重要业务决策。


需要考虑的参数有:


  1. 缓存命中率: 该指标衡量请求项在缓存中被找到次数的百分比。较高的缓存命中率意味着缓存可以提供更多数据,从而减少访问外部存储并提高性能。
  2. 时延: 时延是指访问数据所需时间。在缓存系统中,较低的时延意味着数据服务速度更快,从而提高整体性能。
  3. 吞吐量: 吞吐量度量在给定时间范围内可以处理的数据量。高吞吐量的缓存系统可以处理更多请求,提供更多数据,从而提高整体性能。
  4. 缓存大小: 缓存大小是为缓存分配的内存或存储的容量。缓存大小会影响缓存命中率,较大的缓存可以提高命中率,但也会增加缓存解决方案的成本和复杂性。
  5. 缓存未命中率: 此指标度量请求项在缓存中找不到并且需要从外部存储中获取的次数百分比。高缓存未命中率意味着需要从外部存储获取更多数据,从而对性能造成影响。


如果一直监控这些性能指标,就可以据此优化缓存系统,以获得更高的吞吐量和更低的时延。



读密集型应用缓存

读密集型应用(如 Wordpress/静态图像网站)需要设计缓存系统,以支持更多的读缓存。


下面是一些有用的方法:


  • Cache-aside
  • Cache-through
  • Refresh-ahead
1. Cache-Aside


Cache-aside 方法是最常用的缓存策略之一。


方法


  1. 每当应用发送请求,首先检查缓存中是否有请求的数据。
  2. 如果有,返回缓存的数据。
  3. 否则,应用程序从数据库查询数据,并在返回途中更新缓存,然后返回数据。


优缺点


  • 每次缓存未命中都会导致三次访问,可能会造成明显的时延。
  • 如果有人更新数据库而不写入缓存,可能会读到过期数据。(因此,Cache-aside 通常与其他策略一起使用)。
2. Read-through


在 read-through 方法中,缓存对数据库进行读取/查询操作,然后更新自己并将请求数据返回给最终用户。


方法


  1. 应用程序每次都从缓存中查询数据。
  2. 如果数据不在缓存中,则缓存查询数据库并更新自己。
  3. 缓存将数据返回给最终用户。


优缺点


  • 简化应用程序代码,read-through 策略确保将数据获取逻辑转移到缓存中,从而简化了应用程序代码。
  • 更好的读取可伸缩性。当某个 key 在 Cache-aside 中过期时,并发请求可能会触发多次数据库查询相同的数据。在 Read-through 中,缓存确保只向数据库发送一个查询。
3. Refresh-ahead


Refresh-ahead 策略是在过期之前刷新缓存数据,该方法适用于热数据,即预计在不久的将来会被请求的数据。


方法


  1. 假设缓存数据的过期时间为 60 秒,刷新提前系数为 0.5。
  2. 如果缓存数据在 60 秒后被访问,将从缓存存储执行同步读取以刷新其值。
  3. 如果缓存数据在 30 秒后被访问,比如第 35 秒,缓存将直接返回数据,并异步刷新数据。


优缺点


因此,refresh-ahead 缓存本质上是在下一次可能的缓存访问之前以配置的间隔刷新缓存。在这种读流量非常高的系统中,几毫秒内可能会发生几千个读操作。



写密集型应用缓存

任何写密集型应用程序都需要缓存策略,例如:

1. Write-Through


Write-Through 策略将缓存作为其主数据存储,即首先在缓存中更新数据,然后才在数据库中更新数据。


下面是应用想要写入数据或更新值时发生的情况:


  1. 应用程序将数据直接写入缓存。
  2. 缓存更新主数据库中的数据。当写操作完成时,缓存和数据库都具有相同的值,并且始终保持一致。


优缺点


当与 read-through 配合使用时,在网络调用中非常有效,数据首先被读/写到缓存中,使得几乎不会发生缓存无效的情况。由于所有数据都是新的和经常访问的数据,而且所有对数据库的写入都是通过缓存完成,使得数据库和缓存几乎始终保持一致。

2. Write-back


Write-back 方法与 write-through 非常相似,只是数据库写调用是异步的。


优缺点


  1. Write-back 缓存可以提高写性能,非常适合涉及大量写操作的工作负载。当与 read-through 结合使用时,也非常适合混合工作负载,可以确保最近更新访问的数据始终在缓存中可用。
  2. 降低网络成本: 如果使用批处理调用,还可以减少对数据库的总体写操作,从而减少负载并降低成本,特别是当数据库按请求数量收费时(例如 DynamoDB)。
  3. 缓存使用效率低下: 不经常被请求的数据也会被写入缓存。这点可以通过 TTL 进行优化。
3. Write-around


在 Write-around 方法中,首先将数据更新到数据库,然后数据库对缓存进行异步调用以更新 key。


方法


  1. 当收到写请求时,应用程序更新数据库中的记录。
  2. 数据库异步更新/删除缓存中的键。


优缺点


Write-around 可以与 read-through 结合使用,在数据只写入一次,读取频率较低或从不读取的情况下提供良好的性能(例如实时日志或聊天室)。同样,这种模式也可以与 cache-aside 结合使用。



缓存失效方法

缓存失效是从缓存中删除陈旧或过时数据的过程,以确保只保留最新的可用数据。缓存失效策略有:


  1. 基于时间失效(TTL): 在此策略中,缓存数据在经过一段时间后失效。这是一个简单而有效的策略,易于实施,但可能并不适用于所有用例,因为有些数据可能比其他数据更容易过时。
  2. 基于事件失效: 在此策略中,缓存数据将根据发生的特定事件(如底层数据源更改或其他相关事件)失效。这是一种更有针对性的失效方法,可确保数据仅在必要时失效,但需要与应用和底层数据源进行更层次的集成。
  3. 基于版本失效: 在此策略中,为缓存中的每个数据块分配一个版本号,该版本号在每次数据更改时递增。当数据失效时,将在缓存中更新版本号,以确保仅使用数据的最新版本。这种策略对于频繁更改的数据效果很好,但需要额外的开销来管理版本号。
  4. 最近最少使用(Least recently used, LRU)失效: 在此策略中,当缓存达到容量限制时,缓存中最近最少使用的数据将失效,从而确保在缓存中保留最常用的数据,降低存储陈旧数据的风险。然而,该机制可能并不适合所有用例,因为有些数据可能不被经常访问,但仍然需要缓存。
  5. 手动失效: 在此策略中,失效由应用程序或管理员手动触发。该机制提供了最大的灵活性和对缓存的控制,但需要更多开销来管理失效过程。


具体失效方法包括清除、禁止、刷新等。



结论

总之,上文提到的策略永远不会单独或孤立的起作用,而总是组合工作。例如,Write-around 策略可以与 Cache-aside 策略一起实现,以确保数据一致性。更重要的是,应该了解应用程序的读/写访问模式,因为选择错误的组合可能无法带来最好的结果。


例如,如果在实际应该使用 write-around/read-through(写入的数据访问频率较低)时选择了 write-through/read-through,那么缓存中就会有无用的垃圾。




你好,我是俞凡,在 Motorola 做过研发,现在在 Mavenir 做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI 等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。为了方便大家以后能第一时间看到文章,请朋友们关注公众号"DeepNoMind",并设个星标吧,如果能一键三连(转发、点赞、在看),则能给我带来更多的支持和动力,激励我持续写下去,和大家共同成长进步!

目录
相关文章
|
3月前
|
缓存 算法 数据挖掘
深入理解缓存更新策略:从LRU到LFU
【10月更文挑战第7天】 在本文中,我们将探讨计算机系统中缓存机制的核心——缓存更新策略。缓存是提高数据检索速度的关键技术之一,无论是在硬件还是软件层面都扮演着重要角色。我们会详细介绍最常用的两种缓存算法:最近最少使用(LRU)和最少使用频率(LFU),并讨论它们的优缺点及适用场景。通过对比分析,旨在帮助读者更好地理解如何选择和实现适合自己需求的缓存策略,从而优化系统性能。
73 3
|
28天前
|
缓存 API C#
C# 一分钟浅谈:GraphQL 中的缓存策略
本文介绍了在现代 Web 应用中,随着数据复杂度的增加,GraphQL 作为一种更灵活的数据查询语言的重要性,以及如何通过缓存策略优化其性能。文章详细探讨了客户端缓存、网络层缓存和服务器端缓存的实现方法,并提供了 C# 示例代码,帮助开发者理解和应用这些技术。同时,文中还讨论了缓存设计中的常见问题及解决方案,如缓存键设计、缓存失效策略等,旨在提升应用的响应速度和稳定性。
42 13
|
5月前
|
缓存 Java
Java本地高性能缓存实践问题之Caffeine缓存库中基于时间设置驱逐策略的问题如何解决
Java本地高性能缓存实践问题之Caffeine缓存库中基于时间设置驱逐策略的问题如何解决
|
11天前
|
存储 消息中间件 设计模式
缓存数据一致性策略如何分类?
数据库与缓存数据一致性问题的解决方案主要分为强一致性和最终一致性。强一致性通过分布式锁或分布式事务确保每次写入后数据立即一致,适合高要求场景,但性能开销大。最终一致性允许短暂延迟,常用方案包括Cache-Aside(先更新DB再删缓存)、Read/Write-Through(读写穿透)和Write-Behind(异步写入)。延时双删策略通过两次删除缓存确保数据最终一致,适用于复杂业务场景。选择方案需根据系统复杂度和一致性要求权衡。
42 0
|
2月前
|
存储 缓存 安全
在 Service Worker 中配置缓存策略
Service Worker 是一种可编程的网络代理,允许开发者控制网页如何加载资源。通过在 Service Worker 中配置缓存策略,可以优化应用性能,减少加载时间,提升用户体验。此策略涉及缓存的存储、更新和检索机制。
|
2月前
|
存储 缓存 监控
利用 Redis 缓存特性避免缓存穿透的策略与方法
【10月更文挑战第23天】通过以上对利用 Redis 缓存特性避免缓存穿透的详细阐述,我们对这一策略有了更深入的理解。在实际应用中,我们需要根据具体情况灵活运用这些方法,并结合其他技术手段,共同保障系统的稳定和高效运行。同时,要不断关注 Redis 缓存特性的发展和变化,及时调整策略,以应对不断出现的新挑战。
75 10
|
2月前
|
Web App开发 缓存 UED
如何设置浏览器的缓存策略?
【10月更文挑战第23天】通过合理地设置浏览器的缓存策略,可以在提高网页性能、减少网络流量的同时,确保用户能够获取到最新的内容,从而提升用户体验和网站的性能优化效果。
123 4
|
2月前
|
存储 消息中间件 缓存
缓存策略
【10月更文挑战第25天】在实际应用中,还需要不断地监控和调整缓存策略,以适应系统的变化和发展。
|
2月前
|
缓存 监控 NoSQL
Redis 缓存穿透及其应对策略
【10月更文挑战第23天】通过以上对 Redis 缓存穿透的详细阐述,我们对这一问题有了更深入的理解。在实际应用中,我们需要根据具体情况综合运用多种方法来解决缓存穿透问题,以保障系统的稳定运行和高效性能。同时,要不断关注技术的发展和变化,及时调整策略,以应对不断出现的新挑战。
59 4
|
3月前
|
存储 缓存 NoSQL
保持HTTP会话状态:缓存策略与实践
保持HTTP会话状态:缓存策略与实践