对比介绍
Redis使用跳跃表(Skip List)来实现有序集合(Sorted Set)的存储和操作,而不是使用平衡树(Balanced Tree)或者哈希表(Hash Table),这是因为跳跃表具有以下优点:
跳跃表的实现比较简单,容易理解和实现,而平衡树的实现比较复杂,需要考虑多种情况,容易出错。哈希表虽然实现简单,但是对于有序集合的操作比较困难。
跳跃表可以实现快速的插入、删除和查找操作,时间复杂度为O(log n),与平衡树相当,而哈希表在最好情况下可以实现O(1)的时间复杂度,但是在最坏情况下,时间复杂度为O(n),并且无法实现有序集合的排序和范围查找等操作。
跳跃表可以支持高并发的写入操作,因为每个节点都有多个指针,可以实现多个线程同时插入或删除节点,而平衡树和哈希表都需要进行加锁或者使用复杂的并发控制算法来保证并发的正确性。
虽然跳跃表与平衡树和哈希表相比有一些优点,但是也有一些缺点,比如:
跳跃表的空间复杂度比较高,因为每个节点都需要多个指针来连接不同的层级,而哈希表和平衡树只需要一个指针即可。
跳跃表的查找性能虽然比较好,但是不如哈希表那么快,因为跳跃表需要进行多次比较才能找到指定元素,而哈希表只需要一次哈希计算即可。
平衡树和哈希表特点
平衡树是一种二叉搜索树,它的特点是所有叶子节点深度相同,因此可以保证在最坏情况下的查找、插入和删除操作的时间复杂度都是 O(log n)。常见的平衡树有红黑树、AVL树、B树等。
哈希表是一种通过哈希函数将关键字映射到索引位置的数据结构,它的查询、插入和删除操作的时间复杂度通常是 O(1),但在最坏情况下会退化到 O(n)。哈希表的主要缺点是它不能直接支持范围查询,因此在一些场景下需要使用有序集合。
Redis的有序集合需要支持范围查询,同时还需要支持高效的插入和删除操作,因此采用了跳跃表(Skip List)作为底层数据结构,而不是使用平衡树或哈希表。跳跃表是一种可以高效支持范围查询的有序数据结构,它基于多层链表实现,每一层链表的节点数是前一层的 1/2 左右,而顶层链表的节点数为 2,因此可以在 O(log n) 的时间复杂度内进行范围查询、插入和删除操作。
下面是平衡树、哈希表和跳跃表的简单示意图:
平衡树示意图:
10
/ \
5 15
/ \ \
2 7 20
哈希表示意图:
0 -> "value1"
1 -> "value2"
2 -> "value3"
3 -> "value4"
4 -> "value5"
...
跳跃表示意图:
+------+ +------+ +------+
Head --->| 0 |---->| 1 |--------------| 7 |----> NULL
+------+ +------+ +------+ +------+
| 5 |---| 9 |----> NULL
+------+ +------+
在上面的跳跃表示意图中,每个节点包含了一个值和多个指针,指向同一层的下一个节点和下一层的节点。顶层链表中的节点数最少,每往下一层增加一倍。例如,第一层链表的节点数为 4,第二层链表的节点数为 2,第三层链表的节点数为 1。
对于于一个单链表来讲,即便链表中存储的数据是有序的,如果我们要想在其中查找某个数据,也只能从头到尾遍历链表。这样查找效率就会很低,时间复杂度会很高,是 O(n)。比如查找12,需要7次查找
如果我们增加如下两级索引,那么它搜索次数就变成了3次
总结
从上面可以看出来,Redis使用跳跃表作为有序集合的底层数据结构,主要是因为跳跃表具有实现简单、操作高效、并发性能好等优点,可以满足Redis对有序集合的高效操作需求。同时,Redis也提供了其他数据结构,比如哈希表、列表、集合等,可以根据实际需求来选择合适的数据结构。