常见数据结构-跳表

简介: 常见数据结构-跳表

一,如何理解跳表

简单说跳表(Skip list)就是链表的“二分查找”。redis 的有序集合用的就是跳表算法。跳表是一种各方面性能都比较优秀的动态数据结构,可以支持快速地插入、删除、查找操作,写起来也不复杂,甚至可以替代红黑树(Red-black tree)。

如下图所示,这种链表加多级索引的结构,就是跳表。从图中我们可以看出,原来没有索引的时候,查找 62 需要遍历 62 个结点,现在只需要遍历 11 个结点,速度是不是提高了很多?所以,当链表的长度 n 比较大时,比如 1000、10000 的时候,在构建索引之后,查找效率的提升就会非常明显。

网络异常,图片无法展示
|


如果包含原始链表这一层,整个跳表的高度就是 log2nlog2nlog2n。我们在跳表中查询某个数据的时候,如果每一层都要遍历 mmm 个结点,那在跳表中查询一个数据的时间复杂度就是 O(m∗logn)O(m*logn)O(mlogn)。这里的 mmm333。为什么是 3 呢?解释如下。

假设我们要查找的数据是 x,在第 k 级索引中,我们遍历到 y 结点之后,发现 x 大于 y,小于后面的结点 z,所以我们通过 y 的 down 指针,从第 k 级索引下降到第 k-1 级索引。在第 k-1 级索引中,yz 之间只有 3 个结点(包含 yz),所以,我们在 K-1 级索引中最多只需要遍历 3 个结点,依次类推,每一级索引都最多只需要遍历 3 个结点。

网络异常,图片无法展示
|

通过上面的分析,我们得到 m=3,所以在跳表中查询任意数据的时间复杂度就是 O(logn)O(logn)O(logn)

二,跳表的空间复杂度

比起单纯的单链表,跳表需要存储多级索引,肯定要消耗更多的存储空间。

跳表的空间复杂度分析并不难,假设原始链表大小为 n,那第一级索引大约有 n/2 个结点,第二级索引大约有 n/4 个结点,以此类推,每上升一级就减少一半,直到剩下 2 个结点。如果我们把每层索引的结点数写出来,就是一个等比数列。

这几级索引的结点总和就是 n/2+n/4+n/8…+8+4+2=n−2n/2+n/4+n/8…+8+4+2=n-2n/2+n/4+n/8+8+4+2=n2。所以,跳表的空间复杂度是 O(n)O(n)O(n)。也就是说,如果将包含 n 个结点的单链表构造成跳表,我们需要额外再用接近 n 个结点的存储空间。

在软件开发中,我们不必太在意索引占用的额外空间。在讲数据结构和算法时,我们习惯性地把要处理的数据看成整数,但是在实际的软件开发中,原始链表中存储的有可能是很大的对象,而索引结点只需要存储关键值和几个指针,并不需要存储对象,所以当对象比索引结点大很多时,那索引占用的额外空间就可以忽略了。

三,高效的动态插入和删除

前问叙述了跳表的结构定义和查找数据,实际上,跳表这个动态数据结构,不仅支持查找操作,还支持动态的插入、删除操作,而且插入、删除操作的时间复杂度也是 O(logn)O(logn)O(logn)

在单链表中,一旦定位好要插入的位置,插入结点的时间复杂度是很低的,就是 O(1)O(1)O(1)。但是,这里为了保证原始链表中数据的有序性,我们需要先找到要插入的位置,这个查找操作就会比较耗时。

对于纯粹的单链表,需要遍历每个结点,来找到插入的位置。但是,对于跳表来说,我们讲过查找某个结点的时间复杂度是 O(logn)O(logn)O(logn),所以这里查找某个数据应该插入的位置,方法也是类似的,时间复杂度也是 O(logn)O(logn)O(logn)

四,跳表索引动态更新

当我们不停地往跳表中插入数据时,如果我们不更新索引,就有可能出现某 2 个索引结点之间数据非常多的情况。极端情况下,跳表还会退化成单链表。

五,总结

跳表使用空间换时间的设计思路,通过构建多级索引来提高查询的效率,实现了基于链表的“二分查找”。跳表是一种动态数据结构,支持快速地插入、删除、查找操作,时间复杂度都是 O(logn)O(logn)O(logn)。跳表的空间复杂度是 O(n)O(n)O(n)。不过,跳表的实现非常灵活,可以通过改变索引构建策略,有效平衡执行效率和内存消耗。虽然跳表的代码实现并不简单,但是作为一种动态数据结构,比起红黑树来说,实现要简单多了。所以很多时候,我们为了代码的简单、易读,比起红黑树,我们更倾向用跳表。

参考资料


相关文章
|
27天前
|
存储 NoSQL Redis
Redis常见面试题:ZSet底层数据结构,SDS、压缩列表ZipList、跳表SkipList
String类型底层数据结构,List类型全面解析,ZSet底层数据结构;简单动态字符串SDS、压缩列表ZipList、哈希表、跳表SkipList、整数数组IntSet
|
6月前
|
存储 NoSQL 算法
【高阶数据结构】跳表 -- 详解
【高阶数据结构】跳表 -- 详解
|
6月前
|
C语言 索引
嵌入式中一文搞定C语言数据结构--跳表
嵌入式中一文搞定C语言数据结构--跳表
46 0
|
6月前
|
NoSQL 算法 Java
数据结构之跳表理解
数据结构之跳表理解
98 0
|
6月前
|
NoSQL 算法 Java
数据结构之跳表理解
数据结构之跳表理解
47 0
数据结构之跳表理解
|
6月前
|
NoSQL Go Redis
golang数据结构篇之跳表
golang数据结构篇之跳表
52 0
|
6月前
|
存储 NoSQL Redis
Redis数据结构之——跳表skiplist
Redis数据结构之——跳表skiplist
|
存储 NoSQL Redis
Redis从入门到精通之底层数据结构跳表 SkipList
跳表(Skip List)是一种基于链表的数据结构,用于快速地插入、删除和查找元素。跳表通过多层级的指针数组来实现快速的操作,时间复杂度为O(log n),其中n为跳表中元素的个数。Redis中的有序集合(Sorted Set)就是通过跳表来实现的。
839 10
Redis从入门到精通之底层数据结构跳表 SkipList
|
存储 机器学习/深度学习 算法
数据结构之数组、链表、跳表——算法与数据结构入门笔记(三)
数据结构之数组、链表、跳表——算法与数据结构入门笔记(三)
|
存储 NoSQL 算法
【高阶数据结构】跳表
跳表的原理及其模拟实现