Redis大Key问题如何排查?如何解决?

简介: Redis大Key问题如何排查?如何解决?

Redis 大 Key 是指存储在 Redis 中的键值对,其中键对应的 value 占用了较大的内存空间,或者包含了大量的元素。例如,一个存储了数百万个元素的集合(Set)类型的键,或者一个存储了一个很大的字符串(长度可能达到几十 MB 甚至更大)的键都被认为是大 Key。

Redis 大 Key 并没有统一的固定标准,当字符串存储了一个很大的值,例如 10M 以上,或集合存储了一个上百万元素的值,那就认为是 Redis 的大 Key 问题了。

1.主要影响

大 Key 问题造成的主要问题是让 Redis 服务阻塞,无法处理其他命令的响应(客户端可能因此出现请求超时的问题)。因为对大 Key 进行读写操作时,由于需要处理大量的数据,这些操作可能会非常耗时,这就会导致 Redis 主线程被阻塞,无法及时处理其他客户端的请求。

2.常见场景

大 Key 的常见场景有以下几个:

  1. 缓存大数据(图片和视频元数据):在缓存场景中,可能会将大型的文件内容(如图片、视频元数据)缓存到 Redis 中。例如,一个视频分享网站可能会将视频的详细描述、标签、点赞数、评论数等信息以 JSON 字符串的形式缓存为一个大 Key,方便快速获取视频相关的所有数据。
  2. 明星或网红粉丝列表:如果使用 ZSet 来存储粉丝和关注列表的话,如果是某些明星或网红的粉丝列表将会很大,可能存储元素超千万甚至是亿级别。
  3. 商品页所有信息:在电商应用中,可能需要将商品信息,如商品 ID、名称、描述、价格、库存、图片、评价等都缓存到 Redis 中的话,当商品详情和评价(几十上百万条评价)比较多时,这个 Key 就可能变得非常大。

3.排查大Key问题

排查大 Key 的方案有以下几个。

3.1 BIGKEYS

Redis 自带的 BIGKEYS 命令可以查询当前 Redis 中所有 key 的信息,对整个数据库中的键值对大小情况进行统计分析。它会查出每种数据结构的最大 Key,但不能根据某个容量进行筛查。比如说,统计每种数据类型的键值对个数以及平均大小,如下图所示:

3.2 MEMORY USAGE

Redis 4.0+ 后推出了 MEMORY USAGE 命令,该命令可以返回指定 key 的内存使用情况,返回使用的内存的字节数。通过遍历所有的 key 并使用此命令,可以找出占用内存较大的 key。但需要注意的是,对于复杂数据结构(如 List、Set 等),MEMORY USAGE 命令返回的是近似值,因为它采用抽样方式来估算内存使用,如下图所示:

3.3 OBJECT

OBJECT encoding 可以查看键值对象的编码类型,不同的编码类型可能暗示了键值的复杂程度和大小。例如,如果一个字符串类型的键采用了 raw 编码且长度很长,那么它可能是一个大 Key,如下图所示:

4.解决大Key问题

大 Key 的解决方案有以下几个。

4.1 拆分大Key

将大 Key 拆分成多个小 Key,分别存储不同部分的数据。这样可以减少单个 Key 的内存占用,提高查询性能,拆分的常用方法有以下几个:

  1. 按业务逻辑拆分:如果大 Key 是一个包含大量聚合数据的键,可以根据业务逻辑将其拆分为多个小的键。例如,对于一个包含全品类商品销售数据的大 Key,可以按照品类拆分为多个小的键,每个键只存储一个品类的销售数据。
  2. 按时间范围拆分:对于存储时间序列数据的大 Key,如日志数据或统计数据,可以按照时间范围进行拆分。比如,将一天的日志数据拆分为每小时一个键,这样可以更灵活地管理和删除过期数据。

4.2 使用压缩算法

对于可以压缩的数据类型(如字符串),可以使用压缩算法(如 LZF 等)来减少内存占用。Redis 本身支持一些压缩算法,可以在一定程度上减少大 Key 的内存占用。

4.3 使用合适的数据结构和存储方式

  1. 考虑使用其他存储系统:如果数据实在太大且不适合存储在 Redis 中,可以考虑将部分数据转移到其他存储系统,如将大型文件存储到分布式文件系统(如 MinIO、Ceph 等),只在 Redis 中保留文件的元数据或引用。
  2. 优化 Redis 数据结构选择:根据数据的访问模式和特性,选择更合适的 Redis 数据结构。例如,如果一个集合类型的大 Key 主要用于判断元素是否存在,可以考虑使用布谷鸟哈希(Cuckoo Hash)等空间效率更高的数据结构替代传统的集合结构。

4.4 设置合理的过期时间

如果大 Key 中的数据不是一直需要的,可以设置过期时间,让 Redis 在一定时间后自动删除该 Key。这样可以避免大 Key 长期占用内存,导致内存泄漏。

4.5 加强监控和管理

建立对 Redis 的监控系统,实时监测大 Key 的出现和内存使用情况。当发现大 Key 或者内存占用过高时,及时发出预警,以便采取相应的措施进行处理。如 Redis Insights、Prometheus 等,设置对大 key 和内存使用的监控指标。

注意事项:大Key删除

删除大 Key 时要注意,要使用 UNLINK 命令代替 **DEL** 命令来删除大 Key。UNLINK 命令会立即返回,后台异步删除数据,避免阻塞,如下图所示:

小结

Redis 大 Key 问题会让 Redis 服务阻塞,无法响应其他命令,可能会导致客户端响应超时等问题。排查大 Key 问题可以使用 BIGKEYS、MEMORY USAGE、OBJECT 等命令。它的解决方案有:拆分大 Key、压缩数据、使用合适数据结构和存储方式、设置合理过期时间,以及加强监控和管理等手段。

本文已收录到我的面试小站 www.javacn.site,其中包含的内容有:并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、设计模式、消息队列等模块。

相关文章
|
10天前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
|
14天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
5天前
|
并行计算 前端开发 物联网
全网首发!真·从0到1!万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调
2024年11月12日,阿里云通义大模型团队正式开源通义千问代码模型全系列,包括6款Qwen2.5-Coder模型,每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩,成为全球最强开源代码模型,多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点,通过持续训练,结合源代码、文本代码混合数据及合成数据,显著提升了代码生成、推理和修复等核心任务的性能。此外,该模型还支持多种编程语言,并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创,阿里云社区首发,未经同意不得转载。
|
10天前
|
人工智能 运维 双11
2024阿里云双十一云资源购买指南(纯客观,无广)
2024年双十一,阿里云推出多项重磅优惠,特别针对新迁入云的企业和初创公司提供丰厚补贴。其中,36元一年的轻量应用服务器、1.95元/小时的16核60GB A10卡以及1元购域名等产品尤为值得关注。这些产品不仅价格亲民,还提供了丰富的功能和服务,非常适合个人开发者、学生及中小企业快速上手和部署应用。
|
5天前
|
人工智能 自然语言处理 前端开发
用通义灵码,从 0 开始打造一个完整APP,无需编程经验就可以完成
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。本教程完全免费,而且为大家准备了 100 个降噪蓝牙耳机,送给前 100 个完成的粉丝。获奖的方式非常简单,只要你跟着教程完成第一课的内容就能获得。
|
21天前
|
自然语言处理 数据可视化 前端开发
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
合合信息的智能文档处理“百宝箱”涵盖文档解析、向量化模型、测评工具等,解决了复杂文档解析、大模型问答幻觉、文档解析效果评估、知识库搭建、多语言文档翻译等问题。通过可视化解析工具 TextIn ParseX、向量化模型 acge-embedding 和文档解析测评工具 markdown_tester,百宝箱提升了文档处理的效率和精确度,适用于多种文档格式和语言环境,助力企业实现高效的信息管理和业务支持。
3946 4
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
|
10天前
|
算法 安全 网络安全
阿里云SSL证书双11精选,WoSign SSL国产证书优惠
2024阿里云11.11金秋云创季活动火热进行中,活动月期间(2024年11月01日至11月30日)通过折扣、叠加优惠券等多种方式,阿里云WoSign SSL证书实现优惠价格新低,DV SSL证书220元/年起,助力中小企业轻松实现HTTPS加密,保障数据传输安全。
532 3
阿里云SSL证书双11精选,WoSign SSL国产证书优惠
|
9天前
|
数据采集 人工智能 API
Qwen2.5-Coder深夜开源炸场,Prompt编程的时代来了!
通义千问团队开源「强大」、「多样」、「实用」的 Qwen2.5-Coder 全系列,致力于持续推动 Open Code LLMs 的发展。
|
17天前
|
安全 数据建模 网络安全
2024阿里云双11,WoSign SSL证书优惠券使用攻略
2024阿里云“11.11金秋云创季”活动主会场,阿里云用户通过完成个人或企业实名认证,可以领取不同额度的满减优惠券,叠加折扣优惠。用户购买WoSign SSL证书,如何叠加才能更加优惠呢?
995 3
|
14天前
|
机器学习/深度学习 存储 人工智能
白话文讲解大模型| Attention is all you need
本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档,我们期望为读者提供一个全面的理解,帮助大家掌握大模型的工作原理,增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。
451 18
白话文讲解大模型| Attention is all you need