参考:
0、zset数据结构
- 【有序集合】
- 【本质上是集合,所有元素不能重复】
- 【分数可以重复(相同时根据member字典排序),member不能重复】
- 【支持根据score的范围查找】
1、zset底层的数据结构是什么?
zset底层包含 跳表 和 压缩列表
2、跳表是什么?
跳表(skiplist)是在链表的基础上,增加了多级索引,通过多级索引位置的跳转,实现了快速查找元素。
跳表这一有序集合,底层是一个名为zset的结构体。而一个zset结构同时包含一个字典和一个跳跃表。跳跃表按score从小到大保存所有集合元素。而字典则保存着从member到score的映射,这样就可以用O(1)的复杂度来查找member对应的score值。虽然同时使用两种结构,但它们会通过指针来共享相同元素的member和score,因此不会浪费额外的内存。
3、跳表的时间复杂度:
利用空间换时间,查找、新增、删除的时间复杂度都为:O(logN),类似于二分查找。
4、什么时候使用压缩列表,什么时候使用跳表呢?
- 元素数量小于
128
个 - 所有member的长度都小于
64
字节
5、跳表的内部实现及原理:
- 当链表足够长的时候,这种多层链表的查找方式能让我们跳过很多下层节点,大大加快查找的速度。
- 跳表为了避免链表在新增/删除时,时间复杂度较低为O(n)的问题,它不要求链表相邻节点的上下层数之间有严格的对应关系,而是为每个节点随机出一个层数(level)。
- 从跳表的创建和插入过程可以看出,每一个节点的层数(level)是随机出来的,而且新插入一个节点不会影响其它节点的层数。因此,插入操作只需要修改插入节点前后的指针,而不需要对很多节点都进行调整,这就降低了插入操作的复杂度。实际上,这是跳表的一个很重要的特性。
- 跳表其实除了最下面第1层链表之外,它会产生若干层稀疏的链表,这些链表里面的指针故意跳过了一些节点(而且越高层的链表跳过的节点越多)。这使得我们在查找数据时能先在高层链表中查找,然后逐层降低,最终降到第1层链表来精确查找数据位置。在这个过程中,我们跳过了一些节点,从而也就加快了查找速度。
- 实际应用中的跳表每个节点应该包含member和value两部分。实际上列表中是按照member对应的score值从小到大进行排序的(score值相同时按member字典序排列),查找过程也是根据member来比较。
- MaxLevel = 32,默认最大层数
- 实际上,Redis中sorted set的实现是这样的:
- 当数据较少时:zset是由一个压缩列表来实现的
- 当数据较多时:zset是由一个 字典 + 跳表 来实现的。简单来讲,dict用来查询数据到分数的对应关系,而skiplist用来根据分数查询数据(可能是范围查找)
- 第1层链表不是一个单向链表,而是一个双向链表,这是为了方便以倒序方式获取一个范围内的元素
6、为什么用跳表而不用红黑树或二叉树呢?
- 范围查找时,跳表效率比红黑树高。跳表可以通过查找区间的起点,然后依次往后遍历即可~
- 跳表的实现比红黑树简单(红黑树在新增/删除时,可能会面临反转等操作),更易理解与实现,且可以通过控制跳表的索引层级来控制内存的消耗。