面试官:你了解过Redis对象底层实现吗

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 面试官:你了解过Redis对象底层实现吗

0. 五类对象分别是什么


五类对象就是我们常用的string、list、set、zset、hash


1. 为什么要有对象


我们平时主要是通过操作对象的api来操作redis,而不是通过它的调用它底层数据结构来完成(外观模式)。但我们还需要了解其底层,只有这样才能写最优化高效的代码。


  1. 跟java一样,对象使开发更方便简洁,降低开发门槛。开发者不需要了解其复杂的底层API,直接调用高层接口即可实现开发。
  2. Redis根据对象类型来判断命令是否违法,如果你set key value1 value2就报错。
  3. 对象下可以包含多种数据结构,使数据存储更加多态化。(下面主讲)
  4. Reids基于对象做了垃圾回收(引用计数法)。
  5. 对象带有更丰富的属性,来帮助redis实现更高级的功能。(比如对象的闲置时间)。


2. Redis对象(RedisObject)源码分析


typedef struct redisObject {
    // 类型
    unsigned type:4;
    // 编码
    unsigned encoding:4;
    // 指向底层实现数据结构的指针
    void *ptr;
    // ...
} robj;


type字段


记录对象类型。



我们平时用的命令type <key>,其实就是返回这个字段的属性。


127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> type hello
string
127.0.0.1:6379> rpush list 1 2 3
(integer) 3
127.0.0.1:6379> type list
list
...


那type有多少中类型呢?看下面这个表:


image.png


encoding字段


记录对象使用的编码(数据结构),Reids中称数据结构为encoding。


我们可以这样查看我们redis对象中的encoding:


127.0.0.1:6379> object encoding hello
"embstr"
127.0.0.1:6379> object encoding list
"quicklist"
...



既然它是标明该redisObject是使用的什么数据结构,那肯定也有个对应的表:


image.png


我们可以看到,Redis对对象的底层encoding分的很细,String类型就有三个,其它四个对象都分别有两种不同的底层数据结构的实现。他们有一规律,就是用ziplistintsetembstr来实现少量的数据,数据量一旦庞大,就会升级到skiplistrawlinkedlistht来实现,后面我会仔细讲解。


3. 分别分析各个对象的底层编码实现(数据结构)


3.1 字符串(string)


字符串编码有三个:int、raw、embstr。


3.1.1 int


当string对象的值全部是数字,就会使用int编码。


127.0.0.1:6379> set number 123455
OK
127.0.0.1:6379> object encoding number
"int"

3.1.2 embstr


字符串或浮点数长度小于等于39字节,就会使用embstr编码方式来存储,embstr存储内存一般很小,所以redis一次性分配且内存连续(效率高)。


127.0.0.1:6379> set shortStr "suwe suwe suwe"
OK
127.0.0.1:6379> object encoding shortStr
"embstr"

3.1.2 raw


当一个字符串或浮点数长度大于39字节,就使用SDS来保存,编码为raw,由于不确定值的字节大小,所以键和值各分配各的,所以就分配两次内存(回收也是两次),同理它一定不是内存连续的。


127.0.0.1:6379> set longStr "hello everyone, we dont need to sleep around to go aheard! do you think?"
OK
127.0.0.1:6379> object encoding longStr
"raw"

3.1.3 编码转换


前面说过,Redis会自动对编码进行转换来适应和优化数据的存储。


int->raw


条件:数字对象进行append字母,就会发生转换。


127.0.0.1:6379> object encoding number
"int"
127.0.0.1:6379> append number " is a lucky number"
(integer) 24
127.0.0.1:6379> object encoding number
"raw"


embstr->raw


条件:对embstr进行修改,redis会先将其转换成raw,然后才进行修改。所以embstr实际上是只读性质的。


127.0.0.1:6379> object encoding shortStr
"embstr"
127.0.0.1:6379> append shortStr "(hhh"
(integer) 18
127.0.0.1:6379> object encoding shortStr
"raw"


3.2 列表(list)


列表对象编码可以是:ziplist或linkedlist。


  1. ziplist压缩列表不知道大家还记得不,就是zlbytes zltail zllen entry1 entry2 ..end结构,entry节点里有pre-length、encoding、content属性,忘记的可以返回去看下。


  1. linkedlist,类似双向链表,也是上一章的知识。

3.2.1 编码转换


ziplist->linkedlist


条件:列表对象的所有字符串元素的长度大于等于64字节 & 列表元素数大于等于512. 反之,小于64和小于512会使用ziplist而不是用linkedlist。

这个阈值是可以修改的,修改选项:list-max-ziplist-valuelist-max-ziplist-entriess


3.3 哈希(hash)


哈希对象的编码有:ziplist和hashtable


3.3.1 编码转换


ziplist->hashtable


条件:哈希对象所有键和值字符串长度大于等于64字节 & 键值对数量大于等于512


这个阈值也是可以修改的,修改选项:hash-max-ziplist-valuehash-max-ziplist-entriess


3.4. 集合(set)


集合对象的编码有:intset和hashtable


3.4.1 intset


  1. 集合对象所有元素都是整数


  1. 集合对象元素数不超过512个

3.4.2 编码转换


intset->hashtable



条件:元素不都是整数 & 元素数大于等于512


3.5. 有序集合(zset)


有序集合用到的编码:ziplist和skiplist


大家可能很好奇阿,ziplist的entry中只有属性content可以存放数据,集合也是key-value形式,那怎么存储呢?


第一个节点保存key、第二个节点保存value 以此类推...


3.5.1 为什么要用这两个编码



  1. 如果只用ziplist来实现,无法做到元素的排序,不支持范围查找,能做到元素的快速查找。


  1. 如果只用skiplist来实现,无法做到快速查找,但能做到元素排序、范围操作。

3.5.2 编码转换


ziplist->skiplist


条件:有序集合元素数 >= 128 & 含有元素的长度 >= 64

这个阈值也是可以修改的,修改选项:zset-max-ziplist-valuezset-max-ziplist-entriess


4. 垃圾回收


为什么要说内存回收呢,因为redisObject有一个字段:


typedef struct redisObject {
    // ...
    // 引用计数
    int refcount;
    // ...
} robj;


redis的垃圾回收采用引用计数法(和jvm一样),底层采用一个变量对对象的使用行为进行计数。


  • 初始化为1
  • 对象被引用,+1
  • 对象引用消除,-1
  • 计数器==0, 回收对象


5. 对象共享


5.1 对象共享的体现


  1. redis中,值是整数值且相等的两个对象,redis会将该对象进行共享,且引用计数+1


  1. redis启动会自动生成0-9999的整数值放到内存中来共享。


5.2 为什么要对象共享



节约内存


5.3 为什么不对字符串进行共享


成本太高。


验证整数相等只需要O(1)的时间复杂度,而验证字符串要O(n).


6. 对象的空闲时长


最后,redisObject还有一个字段,记录了对象最后一次被访问的时间:


typedef struct redisObject {
    // ...
    unsigned lru:22;
    // ...
} robj;


因为这个字段记录对象最后一次被访问的时间,所以它可以用来查看该对象多久未使用,即:用当前时间-lru


127.0.0.1:6379> object idletime hello
(integer) 5110


它还关系到redis的热点数据实现,如果我们选择lr算法,当内存超出阈值后会对空闲时长较高的对象进行释放,回收内存。


相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
14天前
|
缓存 NoSQL 关系型数据库
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
本文详解缓存雪崩、缓存穿透、缓存并发及缓存预热等问题,提供高可用解决方案,帮助你在大厂面试和实际工作中应对这些常见并发场景。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
|
1月前
|
存储 NoSQL Java
可能是最漂亮的Redis面试基础详解
我是南哥,相信对你通关面试、拿下Offer有所帮助。敲黑板:本文总结了Redis基础最常见的面试题!包含了Redis五大基本数据类型、Redis内存回收策略、Redis持久化等。相信大部分Redis初学者都会忽略掉一个重要的知识点,Redis其实是单线程模型。我们按直觉来看应该是多线程比单线程更快、处理能力更强才对,比如单线程一次只可以做一件事情,而多线程却可以同时做十件事情。但Redis却可以做到每秒万级别的处理能力,主要是基于以下原因:(1)Redis是基于内存操作的,Redis所有的数据库状态都保存在
可能是最漂亮的Redis面试基础详解
|
30天前
|
存储 消息中间件 NoSQL
Redis 数据结构与对象
【10月更文挑战第15天】在实际应用中,需要根据具体的业务需求和数据特点来选择合适的数据结构,并合理地设计数据模型,以充分发挥 Redis 的优势。
55 8
|
1月前
|
NoSQL Java API
美团面试:Redis锁如何续期?Redis锁超时,任务没完怎么办?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴在面试一线互联网企业时遇到了关于Redis分布式锁过期及自动续期的问题。尼恩对此进行了系统化的梳理,介绍了两种核心解决方案:一是通过增加版本号实现乐观锁,二是利用watch dog自动续期机制。后者通过后台线程定期检查锁的状态并在必要时延长锁的过期时间,确保锁不会因超时而意外释放。尼恩还分享了详细的代码实现和原理分析,帮助读者深入理解并掌握这些技术点,以便在面试中自信应对相关问题。更多技术细节和面试准备资料可在尼恩的技术文章和《尼恩Java面试宝典》中获取。
美团面试:Redis锁如何续期?Redis锁超时,任务没完怎么办?
|
1月前
|
NoSQL 算法 Redis
Redis面试篇
Redis面试篇
41 5
|
1月前
|
缓存 NoSQL Java
Java中redis面试题
Java中redis面试题
42 1
|
1月前
|
JSON 缓存 NoSQL
Redis 在线查看序列化对象技术详解
Redis 在线查看序列化对象技术详解
37 2
|
26天前
|
存储 NoSQL Redis
Redis常见面试题:ZSet底层数据结构,SDS、压缩列表ZipList、跳表SkipList
String类型底层数据结构,List类型全面解析,ZSet底层数据结构;简单动态字符串SDS、压缩列表ZipList、哈希表、跳表SkipList、整数数组IntSet
|
1月前
|
NoSQL Redis
redis 的 key 过期策略是怎么实现的(经典面试题)超级通俗易懂的解释!
本文解释了Redis实现key过期策略的方式,包括定期删除和惰性删除两种机制,并提到了Redis的内存淘汰策略作为补充,以确保过期的key能够被及时删除。
55 1
|
2月前
|
缓存 监控 NoSQL
阿里面试让聊一聊Redis 的内存淘汰(驱逐)策略
大家好,我是 V 哥。粉丝小 A 面试阿里时被问到 Redis 的内存淘汰策略问题,特此整理了一份详细笔记供参考。Redis 的内存淘汰策略决定了在内存达到上限时如何移除数据。希望这份笔记对你有所帮助!欢迎关注“威哥爱编程”,一起学习与成长。
下一篇
无影云桌面