认真学习数据结构之AVL树

简介: 认真学习数据结构之AVL树

AVL树是最先发明的自平衡二叉查找树。在AVL树中任何结点的两个子树的高度最大差别为1,所以它也被称为高度平衡树。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。AVL树得名于它的发明者G. M. Adelson-Velsky和E. M. Landis,他们在1962年的论文《An algorithm for the organization of information》中发表了它。

AVL 树是一种平衡二叉树,得名于其发明者的名字( Adelson-Velskii 以及 Landis)

在这个网站可以看到AVL树的可视化:AVL Tree Visualization

【1】概念介绍

二叉查找树只限制了结点值大小:

  • 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;
  • 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值。

那么在极端情况下,可能出现如下情况,此时查找的时间复杂度从O(logN)退化为O(N)


8554c240974c4f10ae35f468acb30bd1.png

我们理想的情况是如下所示,只需要O(logN)就可以查找到结点(N是总结点个数)。


这就是为什么引入AVL树。相对于二叉查找树,其维护了平衡:每个结点的左右子树的高度之差的绝对值(平衡因子)最多为1

总结其特点如下:

本身首先是一棵二叉搜索树(二叉查找树)。

左右子树也是AVL树

带有平衡条件:每个结点的左右子树的高度之差的绝对值(平衡因子)最多为1

如果它有n个结点,其高度可保持在logn ,搜索时间复杂度O(logn)

AVL树好的解决了二叉查找树退化成链表的问题,把插入,查找,删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间,不过相对二叉查找树来说,时间上稳定了很多。

树高的证明

设 fn为高度为 n 的 AVL 树所包含的最少结点数,则有:

显然 fn 是一个斐波那契数列。众所周知,斐波那契数列是以指数的速度增长的,因此 AVL 树的高度为O(logn)

【2】插入时四种旋转操作

为了位置平衡,那么AVL树在插入和删除时需要重新调整结构,这里可能会发生旋转动作。

这里先引入一个概念:平衡因子。

平衡因子:将二叉树上结点的左子树高度减去右子树高度的值称为该结点的平衡因子BF(Balance Factor)。

对于平衡二叉树,BF的取值范围为[-1,1]。如果发现某个结点的BF值不在此范围,则需要对树进行调整。

如下图所示,平衡因子我们这里取了绝对值。

如果这时插入结点5,那么就会触发左旋,根结点平衡因子并未发生变化。

插入一个结点,只会影响根结点到插入结点的父结点上这条路径上所有结点的平衡因子。

二叉树的平衡化有两大基础操作: 左旋和右旋。左旋,即是逆时针旋转;右旋,即是顺时针旋转。这种旋转在整个平衡化过程中可能进行一次或多次,这两种操作都是从失去平衡的最小子树根结点开始的(即离插入结点最近且平衡因子超过1的祖结点)。


下面我们总结四种场景的旋转。


① 左旋(RR调整)

这个如前面所示,当再次插入结点5时,就会触发左旋操作。总结就是插入了较高右子树的右侧结点

如果插入一个结点后,插入结点的父结点的平衡因子变成了0,则说明插入结点后树的高度没有发生变化,则只影响了父结点的平衡因子。

如果继续插入结点6呢?这时会导致父结点(2)的平衡因子变成2 ,那么就会触发父结点的左旋,使结点4变成新的父结点。

如果插入一个结点后,该结点的父结点的平衡因子的绝对值大于等于1,在向上更新过程中如果某一个结点的平衡因子变成了0则停止更新,最坏情况下一直要更新到根结点。

27a12bc1cd014ee3b9c7cc64a77e3477.png

② 右旋(LL调整)

与RR调整相对的是,LL调整也就是在较高左侧子树插入左侧结点。

如下所示,插入结点2,那么会导致父结点4的平衡因子变为2,这时需要进行右旋。右旋之后根结点5的平衡因子变为了1(无需调整),调整结束。


如果继续插入结点1呢?按照平衡二叉树的规则,这时会插入到结点2的左侧。这时会打破根结点的平衡因子,发生根结点的变化。

  • 调整原先根结点(5)的左侧结点(3)为新的根结点(3)
  • 旧的根结点作为新的根结点的右子结点
  • 原先左侧结点(3)的右侧结点(4)作为旧的根结点(5)的左侧结点(4)


总结来看,根结点进行变化的前提条件是左子树(右子树)没有办法经过调整维持原先的树高度。比如左子树(右子树)已经是一棵满二叉树(或者是不存在没有兄弟结点的叶子结点),那么此时再在左子树(右子树)插入新的结点,只能通过修改根结点来调整平衡。


③ 先左旋后右旋(LR调整)

也就是插入较高左侧子树的右孩子结点。


如下图所示,这里首先对34进行左旋调整4为3的父结点,然后对整体进行右旋,提升4为新的根结点,原先的根结点5降为4的右结点。

d2bb80add82e48ff918cebe498b90297.png


④ 先右旋再左旋(RL调整)

也就是插入较高右侧子树的左侧结点

如下图所示,这里首先对67进行右旋调整6为7的父结点,然后对整体进行左旋,提升6为新的根结点,原先的根结点5降为6的左结点。

关于插入的总结


AVL树也是一颗二叉搜索树,因此它在插入数据时也需要先找到要插入的位置然后再将结点插入。不同的是,AVL树插入结点后需要对结点的平衡因子进行调整(自底向上折回调整),如果插入结点后平衡因子的绝对值大于1,则还需要对该树进行旋转,旋转成为一颗高度平衡的二叉搜索树。


【3】删除操作

首先这里我们回顾一下二叉查找树的前驱和后继结点。

① 前驱结点

某结点的前驱结点就是小于该结点中的最大结点。


主要有③个场景:


① 如果某个结点存在左子结点,那么左子结点(子树)下中的最大 key 值结点即是前驱。比如结点4的前驱是2。

② 如果某个结点没有左子结点,而且如果该结点为其父结点的右子结点,那么该结点的父结点即为该结点的前驱。比如结点3的前驱是2.

  • ③ 如果某个结点没有左子结点,而且如果该结点为其父结点的左子结点,那么就往顶端寻找,直到找到第一个结点A并且A是其父结点的右子结点,结点A的父结点就是要找的前驱。比如结点7的前驱是6


② 后继结点

某结点的后继就是大于该结点的所有结点中最小的那个结点

仍旧以下图为例:


同样有3种场景


① 如果某个结点存在右子结点,那么右子结点(子树)下中的最小 key 值结点即是后继。比如结点6的后继是7

② 如果某个结点没有右子结点,而且如果该结点为其父结点的左子结点,那么该结点的父结点即为该结点的后继。比如结点7的后继是8

③ 如果某个结点没有右子结点,而且如果该结点为其父结点的右子结点,那么就往顶端寻找,直到找到第一个结点A且A是其父结点的左子结点,A的父结点就是要找的后继。比如3的后继是4,结点A是2.

③ AVL的结点删除

AVL的结点删除和 BST 类似,将结点与后继交换后再删除。删除会导致树高以及平衡因子变化,这时需要沿着被删除结点到根的路径来调整这种变化。如何调整变化?其实就是类似插入时的“旋转操作”。

如下所示,我们删除结点4:

那么第一步则是将结点4与后继(结点5)交换,然后删除结点4:

这时可以看到左侧结点5的平衡因子是2,打破了AVL树的性质,典型的LR结构,那么我们进行先左旋再右旋的调整。

整体来看,AVL树的查找、插入和删除在平均和最坏情况下都是O(logn)。


目录
相关文章
|
3月前
|
存储 算法
数据结构与算法学习二二:图的学习、图的概念、图的深度和广度优先遍历
这篇文章详细介绍了图的概念、表示方式以及深度优先遍历和广度优先遍历的算法实现。
73 1
数据结构与算法学习二二:图的学习、图的概念、图的深度和广度优先遍历
|
2月前
|
算法
数据结构之博弈树搜索(深度优先搜索)
本文介绍了使用深度优先搜索(DFS)算法在二叉树中执行遍历及构建链表的过程。首先定义了二叉树节点`TreeNode`和链表节点`ListNode`的结构体。通过递归函数`dfs`实现了二叉树的深度优先遍历,按预序(根、左、右)输出节点值。接着,通过`buildLinkedList`函数根据DFS遍历的顺序构建了一个单链表,展示了如何将树结构转换为线性结构。最后,讨论了此算法的优点,如实现简单和内存效率高,同时也指出了潜在的内存管理问题,并分析了算法的时间复杂度。
56 0
|
2月前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
69 5
|
2月前
|
存储 算法 安全
2024重生之回溯数据结构与算法系列学习之串(12)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丟脸好嘛?】
数据结构与算法系列学习之串的定义和基本操作、串的储存结构、基本操作的实现、朴素模式匹配算法、KMP算法等代码举例及图解说明;【含常见的报错问题及其对应的解决方法】你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!
2024重生之回溯数据结构与算法系列学习之串(12)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丟脸好嘛?】
|
2月前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
104 16
|
2月前
|
算法 安全 搜索推荐
2024重生之回溯数据结构与算法系列学习(8)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第2.3章之IKUN和I原达人之数据结构与算法系列学习x单双链表精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!
|
2月前
|
存储 算法 安全
2024重生之回溯数据结构与算法系列学习之顺序表【无论是王道考研人还真爱粉都能包会的;不然别给我家鸽鸽丢脸好嘛?】
顺序表的定义和基本操作之插入;删除;按值查找;按位查找等具体详解步骤以及举例说明
|
2月前
|
算法 安全 搜索推荐
2024重生之回溯数据结构与算法系列学习之单双链表精题详解(9)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第2.3章之IKUN和I原达人之数据结构与算法系列学习x单双链表精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!
|
2月前
|
存储 Web App开发 算法
2024重生之回溯数据结构与算法系列学习之单双链表【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构之单双链表按位、值查找;[前后]插入;删除指定节点;求表长、静态链表等代码及具体思路详解步骤;举例说明、注意点及常见报错问题所对应的解决方法
|
2月前
|
算法 安全 NoSQL
2024重生之回溯数据结构与算法系列学习之栈和队列精题汇总(10)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第3章之IKUN和I原达人之数据结构与算法系列学习栈与队列精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!