一文学会树形查找算法

简介: 本文主要详细介绍树形查找中的排序二叉树、平衡二叉树、红黑树、B树以及B+树。

一.二叉排序树(BST)

1.个人理解

  • 左子树结点值 < 根结点值 < 右子树结点值
  • 对二叉排序树进行中序遍历,可以得到一个递增的有序数列

2.二叉树查找

原理:

对于一个给定的二叉排序树,如果要查找一个节点,可以按照以下步骤进行:

  1. 从根节点开始比较。
  2. 如果要查找的值等于当前节点的值,则找到了目标节点,返回该节点。
  3. 如果要查找的值小于当前节点的值,则在左子树中继续查找。
  4. 如果要查找的值大于当前节点的值,则在右子树中继续查找。
  5. 如果在整棵树中都没有找到目标节点,则返回空指针或者抛出异常表示未找到。

时间复杂度为O(log n),其中n为树中节点的数量,因为每次查找都会将搜索范围缩小一半。

3.查找算法实现

//在二叉排序树中查找值为key的结点
BSTNode *BST_ _Search(BSTree T,int key){
   
    while(T!=NULL&&key!=T->key){
    
    //若树空或等 于根结点值,则结束循环
    if(key<T->key) 
        T=T->lchild;                  //小于,则在左子树上查找
    else 
        T=T->rchild;                  //大于,则在右子树上查找
    }
    return T;
}

这个过程显然是一个递归的过程,可以使用递归来完成查找,这里并没有使用递归,递归算法编写请参考【递归算法

4.二叉排序树插入

原理:

若原二叉排序树为空,则直接插入结点:否则,若关键字k小于根结点值,则插入到左子树,若关键字k大于根结点值,则插入到右子树。

算法实现:

//在二叉排序树插入关键字为k的新结点(递归实现)
int BST_ Insert(BSTree &T, int k){
   
    if(T==NULL){
                           //原树为空, 新插入的结点为根结点
        T=(BSTree)malloc(sizeof(BSTNode));
        T->key=k;
        T->lchild=T->rchild=NULL
        return 1;                      //返回1,插入成功
    }
    else if(k==T->key)                  //树中存在相同关键字的结点,插入失败
        return 0;
    else if(k<T->key)                   //插入到T的左子树
    return BST_ Insert(T->lchild,k);
else                                    //插入到T的右子树
    return BST_ Insert(T->rchild,k);
}

5.二叉排序树删除

二叉排序树的删除操作需要分为以下几个步骤:

  1. 查找待删除节点:从根节点开始,比较待删除节点的关键字和当前节点的关键字,如果相等,则找到了待删除节点;否则,继续在左子树或右子树中查找。

  2. 分情况讨论:

    a. 待删除节点没有左右子树:直接删除该节点即可;

    b. 待删除节点只有左子树或右子树:将待删除节点的左子树或右子树挂在其父节点的相应位置上,并删除待删除节点;

    c. 待删除节点既有左子树又有右子树:找到待删除节点的中序遍历的前驱或后继节点(即比待删除节点小的最大节点或比待删除节点大的最小节点),用前驱或后继节点的值替换待删除节点的值,然后将问题转化成删除前驱或后继节点。

  3. 如果删除的是根节点,则需要将新的根节点返回。

原理图:

wKjZ.jpg

代码可以参考数据结构专栏之树这一篇博客,我以后会写的。

二.平衡二叉树(AVL树)

1.平衡二叉树

平衡二叉树(Balanced Binary Tree),简称平衡树,是一种特殊的二叉查找树。它的特点是:任意节点的左右子树高度差不超过1,即每个节点的左右子树高度之差的绝对值都不超过1。这样可以保证查找、插入和删除等操作的时间复杂度为O(log n),提高了树的性能。

平衡二叉树的常见实现有AVL树、红黑树、B树等,其中AVL树是最早被发明的平衡树之一。AVL树要求每个节点的左右子树高度差的绝对值不超过1,并在插入或删除节点后通过旋转操作来自动调整树的结构以满足平衡条件。

平衡二叉树的优点是在保证基本的查找、插入、删除操作的时间复杂度为O(log n)的同时,还具有较好的空间利用率和较小的树高,适合存储大量数据的情况。缺点是相比于普通二叉查找树,平衡树的实现较为复杂,且维护平衡状态增加了插入、删除节点的开销。

2.平衡二叉树的插入

平衡二叉树的插入操作分为以下几步:

  1. 如果树为空,将要插入的节点作为根节点。
  2. 如果插入的元素小于当前节点的值,则在左子树上递归插入;如果插入的元素大于当前节点的值,则在右子树上递归插入。
  3. 在递归返回的过程中,检查当前节点是否失衡。如果当前节点失衡了,需要进行相应的旋转操作来恢复平衡。

对于平衡二叉树的旋转操作,有以下两种:

  1. 左旋转:对于节点 A,如果它的右子树比左子树高出 1 或者 2 层,那么进行左旋转。具体操作是,把 A 的右子节点作为新的根节点,A 变成新根节点的左子树,新根节点的原左子树变成 A 的新右子树。
  2. 右旋转:与左旋转类似,对于节点 A,如果它的左子树比右子树高出 1 或者 2 层,那么进行右旋转。具体操作是,把 A 的左子节点作为新的根节点,A 变成新根节点的右子树,新根节点的原右子树变成 A 的新左子树。

针对这一点,博主建议前往B站看一个五分钟的视频即可理解。

这里博主推荐一个视频,供大家参考:平衡二叉树的插入

3.平衡二叉树的删除

平衡二叉树的删除操作与普通二叉搜索树的删除操作相似,但需要在删除节点之后重新平衡树结构,以保证树的高度始终为 logn

具体的删除操作可以分为以下三个步骤:

  1. 定位待删除节点,并进行删除。如果待删除节点是叶子节点,则直接删除;如果待删除节点只有一个子节点,则将其子节点替换为自己即可;如果待删除节点有两个子节点,则找到其右子树的最小节点(或者左子树的最大节点),将其值赋给当前节点,然后删除这个右子树的最小节点(或左子树的最大节点)。
  2. 从删除节点的父节点开始向上回溯,更新祖先节点的平衡因子。如果发现某个祖先节点的平衡因子的绝对值大于1,则需要进行旋转操作使其重新平衡。
  3. 对于任何因为删除而导致失衡的子树,都要进行旋转操作,以恢复平衡。

具体的旋转操作包括左旋、右旋、左右旋和右左旋四种情况,不同的情况需要选择不同的旋转方式来达到平衡。其中左旋将左子树上移一层,右旋将右子树上移一层,左右旋将左子树先右旋再上移,右左旋将右子树先左旋再上移。

三.红黑树(RBT)

1.定义与性质

红黑树是一种自平衡二叉搜索树,它保证在最坏情况下基本动态集合操作的时间复杂度为 O(log n)。

红黑树的性质如下:

  1. 每个节点要么是红色,要么是黑色。
  2. 根节点是黑色的。
  3. 每个叶子节点(NIL节点)是黑色的。
  4. 如果一个节点是红色的,则它的两个子节点都是黑色的。
  5. 对于任意一个节点,从该节点到其所有后代叶子节点的简单路径上,均包含相同数目的黑色节点(即黑高相等)。

其中,性质 4 是红黑树与普通二叉搜索树的区别所在。这个性质保证了红黑树的黑高不会超过红高的两倍,从而保证了树的平衡性。

口诀:“左右根、根叶黑、不红红、黑路同。”

2.RBT插入

红黑树是一种自平衡的二叉搜索树,它保证了在最坏情况下基本动态操作(插入、删除、查找)的时间复杂度为 O(log n)。

红黑树的插入操作可以分为以下几个步骤:

  1. 将新节点插入到红黑树中,使用二叉搜索树基本插入操作。
  2. 将新节点标记为红色。
  3. 进行颜色调整,确保不破坏红黑树的五个性质。
    1. 父节点和子节点不能同时为红色。
    2. 根节点必须为黑色。
    3. 所有叶子节点都是黑色的空节点(NIL节点)。
    4. 从任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点。
    5. 每个红色节点必须有两个黑色子节点。

颜色调整包括三种情况:

第一种情况:新节点的父节点是黑色。这种情况下没有任何问题,直接返回即可。

第二种情况:新节点的父节点是红色,而且新节点的叔叔节点也是红色。这种情况下需要进行重新着色,将父节点和叔叔节点都变为黑色,祖父节点变为红色,然后把祖父节点作为新节点继续进行调整。

第三种情况:新节点的父节点是红色,而且新节点的叔叔节点是黑色或者空节点。这种情况下需要进行旋转操作,将当前节点和其父节点左旋或右旋,然后重新着色。

通过以上步骤,就可以完成红黑树的插入操作,并保证了红黑树的五个性质。

wEhg.jpg

四.B树(多路平衡查找树)

1.定义与性质

B树,又称多路平衡查找树,B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示。一棵m阶B树或为空树,或为满足如下特性的m叉树:

  • 1)树中每个结点至多有m棵子树,即至多含有m-1个关键字。
  • 2)若根结点不是终端结点,则至少有两棵子树。
  • 3)除根结点外的所有非叶结点至少有[m/2]棵子树,即至少含有[m/21-1个关键字。
  • 5)所有的叶结点都出现在同-层次上,并且不带信息(可以视为外部结点或类似于折半查找判定树的查找失败结点,实际上这些结点不存在,指向这些结点的指针为空)

2.B树高度

B树的高度取决于它的节点数和每个节点所能容纳的关键字数量。B树通常被描述为一棵平衡树,因为它会在插入或删除元素时自动调整其结构,以保持树的平衡。

对于一棵B树来说,它的根节点到最深叶子节点的路径长度就是这棵树的高度。由于B树的每个节点都可以包含多个关键字,因此它比二叉搜索树更加紧密,这意味着它的高度要低得多。具体而言,如果一个B树的节点最多可以包含k个关键字,那么它的高度不会超过logk(n+1),其中n是这棵树中关键字的总数。

因此,B树通常可以在O(log n)时间内查找、插入和删除关键字,即使当数据量非常大时也能够保持高效。

3.插入与删除

B树的插入操作大致分为以下几个步骤:

  1. 首先,我们需要先在B树中找到要插入新关键字的位置,这个过程类似于查找操作。
  2. 如果找到了对应的叶子节点,就直接将新关键字插入到叶子节点中;
  3. 如果叶子节点已满,那么我们需要先进行节点分裂操作,将该节点分成两个节点,并调整父节点指向这两个节点的链接;
  4. 重复执行上述过程,直到插入新关键字成功。

B树的删除操作也比较复杂,大致分为以下几个步骤:

  1. 在B树中查找待删除的关键字,如果找不到则直接返回;
  2. 如果待删除的关键字所在的节点不是叶子节点,则需要用该节点的前驱或后继关键字代替待删除关键字,并将前驱或后继关键字删除;
  3. 如果待删除的关键字所在节点是叶子节点,则直接删除该关键字;
  4. 如果删除操作导致某个节点的关键字数量小于最小值,则需要进行节点合并操作,将该节点与其兄弟节点合并,并调整父节点指向这两个节点的链接;
  5. 重复执行上述步骤,直到删除操作完成。

需要注意的是,在B树中,为了保证平衡性,插入和删除操作都可能导致节点分裂或合并,从而改变B树的结构。因此,B树的插入和删除操作相对于普通的二叉搜索树来说更加复杂。

五.B+树

B+树是一种基于B树的数据结构,与B树相比,在存储大量数据时具有更好的性能和空间利用率。

B+树和B树的区别主要在于:

  1. B+树中的非叶子节点不保存关键字对应的值,只保存关键字和指向子节点的指针;
  2. 所有的关键字都保存在叶子节点中,且叶子节点之间按照顺序连接形成一个链表;
  3. 叶子节点中的每个关键字都会连同其对应的值一起被保存;
  4. 叶子节点的指针指向记录的真实存储地址。

B+树的优点在于:

  1. 因为所有的关键字都保存在叶子节点中,所以遍历所有的关键字时无需进行多余的非叶子节点的遍历,这大大减少了I/O操作次数,提高了查找效率;
  2. 叶子节点之间形成的链表可以进一步提高范围查询的效率;
  3. 非叶子节点占用的空间比较小,因为它们只需要保存关键字和指向子节点的指针,而不需要保存对应的值。

总体来说,B+树适用于对于大规模数据的读取,能够提供更快的查询速度和更好的空间利用率,因此在大多数应用场景中,B+树是比B树更好的选择。

六.比较分析

1.时间复杂度

wlvb.jpg

2.个人理解

平衡二叉树和红黑树本身都是一种二叉排序树,只是在此基础上增添了新的规则而已。

所以进行插入和删除操作时需要进行定位的方法也是二叉排序树使用的方法。

相关文章
|
9天前
|
存储 算法 测试技术
【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
本任务旨在实现二叉树的遍历,包括先序、中序、后序和层次遍历。首先介绍了二叉树的基本概念与结构定义,并通过C++代码示例展示了如何定义二叉树节点及构建二叉树。接着详细讲解了四种遍历方法的递归实现逻辑,以及层次遍历中队列的应用。最后提供了测试用例和预期输出,确保代码正确性。通过这些内容,帮助读者理解并掌握二叉树遍历的核心思想与实现技巧。
32 2
|
5月前
|
存储 算法 C语言
"揭秘C语言中的王者之树——红黑树:一场数据结构与算法的华丽舞蹈,让你的程序效率飙升,直击性能巅峰!"
【8月更文挑战第20天】红黑树是自平衡二叉查找树,通过旋转和重着色保持平衡,确保高效执行插入、删除和查找操作,时间复杂度为O(log n)。本文介绍红黑树的基本属性、存储结构及其C语言实现。红黑树遵循五项基本规则以保持平衡状态。在C语言中,节点包含数据、颜色、父节点和子节点指针。文章提供了一个示例代码框架,用于创建节点、插入节点并执行必要的修复操作以维护红黑树的特性。
123 1
|
7月前
|
存储 算法 Java
Java中,树与图的算法涉及二叉树的前序、中序、后序遍历以及DFS和BFS搜索。
【6月更文挑战第21天】Java中,树与图的算法涉及二叉树的前序、中序、后序遍历以及DFS和BFS搜索。二叉树遍历通过访问根、左、右子节点实现。DFS采用递归遍历图的节点,而BFS利用队列按层次访问。以下是简化的代码片段:[Java代码略]
55 4
|
2月前
|
算法
树的遍历算法有哪些?
不同的遍历算法适用于不同的应用场景。深度优先搜索常用于搜索、路径查找等问题;广度优先搜索则在图的最短路径、层次相关的问题中较为常用;而二叉搜索树的遍历在数据排序、查找等方面有重要应用。
47 2
|
7月前
|
存储 算法 Linux
【数据结构和算法】---二叉树(1)--树概念及结构
【数据结构和算法】---二叉树(1)--树概念及结构
68 0
|
3月前
|
存储 算法 关系型数据库
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
这篇文章主要介绍了多路查找树的基本概念,包括二叉树的局限性、多叉树的优化、B树及其变体(如2-3树、B+树、B*树)的特点和应用,旨在帮助读者理解这些数据结构在文件系统和数据库系统中的重要性和效率。
39 0
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
|
4月前
|
大数据 UED 开发者
实战演练:利用Python的Trie树优化搜索算法,性能飙升不是梦!
在数据密集型应用中,高效搜索算法至关重要。Trie树(前缀树/字典树)通过优化字符串处理和搜索效率成为理想选择。本文通过Python实战演示Trie树构建与应用,显著提升搜索性能。Trie树利用公共前缀减少查询时间,支持快速插入、删除和搜索。以下为简单示例代码,展示如何构建及使用Trie树进行搜索与前缀匹配,适用于自动补全、拼写检查等场景,助力提升应用性能与用户体验。
79 2
|
3月前
|
存储 算法
数据结构与算法学习十六:树的知识、二叉树、二叉树的遍历(前序、中序、后序、层次)、二叉树的查找(前序、中序、后序、层次)、二叉树的删除
这篇文章主要介绍了树和二叉树的基础知识,包括树的存储方式、二叉树的定义、遍历方法(前序、中序、后序、层次遍历),以及二叉树的查找和删除操作。
39 0
|
3月前
|
存储 算法 Java
数据结构和算法--分段树
数据结构和算法--分段树
29 0

热门文章

最新文章