《恋上数据结构第1季》B 树

简介: 《恋上数据结构第1季》B 树
数据结构与算法笔记目录《恋上数据结构》 笔记目录

想加深 Java 基础推荐看这个Java 强化笔记目录

我的《恋上数据结构》源码(第1季 + 第2季):https://github.com/szluyu99/Data_Structure_Note

B树是一种平衡的多路搜索树,多用于文件系统、数据库的实现;

仔细观察B树,有什么眼前一亮的特点?

  • 1 个节点可以存储超过 2 个元素、可以拥有超过 2 个子节点
  • 拥有二叉搜索树的一些性质
  • 平衡,每个节点的所有子树高度一致
  • 比较矮

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

m阶B树的性质

在这里插入图片描述数据库实现中一般用几阶B树?

  • 200 ~ 300

B树 vs 二叉搜索树

B树二叉搜索树,在逻辑上是等价的;

多代节点合并,可以获得一个超级节点

  • 2 代合并的超级节点,最多拥有 4 个子节点(至少是 4 阶B树)
  • 3 代合并的超级节点,最多拥有 8 个子节点(至少是 8 阶B树)
  • n 代合并的超级节点,最多拥有 2^n^ 个子节点( 至少是 2^n^ 阶B树)

m 阶 B树,最多需要 log2^m^ 代合并;
在这里插入图片描述

搜索

跟二叉搜索树的搜索类似:
在这里插入图片描述

  1. 先在节点内部从小到大开始搜索元素
  2. 如果命中,搜索结束
  3. 如果未命中,再去对应的子节点中搜索元素,重复步骤 1

添加 – 上溢

新添加的元素必定是添加到叶子节点:
在这里插入图片描述
插入 55:
在这里插入图片描述
插入 95:
在这里插入图片描述
再插入 98 呢?(假设这是一棵 4阶B树)

  • 最右下角的叶子节点的元素个数将超过限制
  • 这种现象可以称之为:上溢(overflow)

添加 – 上溢的解决(假设5阶)

上溢节点的元素个数必然等于 m;

假设上溢节点最中间元素的位置为 k

  • 将 k 位置的元素向上与父节点合并
  • 将 [0, k - 1] 和 [k + 1, m - 1] 位置的元素分裂成 2 个子节点
    这 2 个子节点的元素个数,必然都不会低于最低限制(┌ m/2 ┐ − 1)

    一次分裂完毕后,有可能导致父节点上溢,依然按照上述方法解决

  • 最极端的情况,有可能一直分裂到根节点

在这里插入图片描述
添加示例:
在这里插入图片描述
插入 98:
在这里插入图片描述
插入 52:
在这里插入图片描述
插入 54:
在这里插入图片描述

删除

删除 – 叶子节点

假如需要删除的元素在叶子节点中,那么直接删除即可;
例:删除 30
在这里插入图片描述

删除 – 非叶子节点

假如需要删除的元素在非叶子节点

  1. 先找到前驱或后继元素,覆盖所需删除元素的值
  2. 再把前驱或后继元素删除

例:删除 60
在这里插入图片描述
非叶子节点的前驱或后继元素,必定在叶子节点中

  • 所以这里的删除前驱或后继元素 ,就是最开始提到的情况:删除的元素在叶子节点中
  • 真正的删除元素都是发生在叶子节点中;

删除 – 下溢

在这里插入图片描述
删除 22?(假设这是一棵 5阶B树)

  • 叶子节点被删掉一个元素后,元素个数可能会低于最低限制( ┌ m/2 ┐ − 1 )
  • 这种现象称为:下溢(underflow)

删除 – 下溢的解决

下溢节点的元素数量必然等于 ┌ m/2 ┐ − 2

如果下溢节点临近的兄弟节点,有至少 ┌ m/2 ┐ 个元素,可以向其借一个元素

  • 将父节点的元素 b 插入到下溢节点的 0 位置(最小位置)
  • 用兄弟节点的元素 a(最大的元素)替代父节点的元素 b
  • 这种操作其实就是:旋转

在这里插入图片描述

如果下溢节点临近的兄弟节点,只有 ┌ m/2 ┐ − 1 个元素

  • 将父节点的元素 b 挪下来跟左右子节点进行合并
  • 合并后的节点元素个数等于┌ m/2 ┐ + ┌ m/2 ┐ − 2,不超过 m − 1
  • 这个操作可能会导致父节点下溢,依然按照上述方法解决,下溢现象可能会一直往上传播

在这里插入图片描述

删除示例:
在这里插入图片描述

4阶B树

如果先学习 4 阶 B 树(2 - 3 - 4 树),将能更好地学习理解红黑树:

4阶B树的性质:

  • 所有节点能存储的元素个数 x :1 ≤ x ≤ 3
  • 所有非叶子节点的子节点个数 y :2 ≤ y ≤ 4

添加:从 1 添加到 22
在这里插入图片描述

相关文章
|
1月前
|
算法
数据结构之博弈树搜索(深度优先搜索)
本文介绍了使用深度优先搜索(DFS)算法在二叉树中执行遍历及构建链表的过程。首先定义了二叉树节点`TreeNode`和链表节点`ListNode`的结构体。通过递归函数`dfs`实现了二叉树的深度优先遍历,按预序(根、左、右)输出节点值。接着,通过`buildLinkedList`函数根据DFS遍历的顺序构建了一个单链表,展示了如何将树结构转换为线性结构。最后,讨论了此算法的优点,如实现简单和内存效率高,同时也指出了潜在的内存管理问题,并分析了算法的时间复杂度。
51 0
|
2月前
|
存储 算法 搜索推荐
探索常见数据结构:数组、链表、栈、队列、树和图
探索常见数据结构:数组、链表、栈、队列、树和图
117 64
|
24天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
45 5
|
1月前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
81 16
|
1月前
|
算法
数据结构之文件系统模拟(树数据结构)
本文介绍了文件系统模拟及其核心概念,包括树状数据结构、节点结构、文件系统类和相关操作。通过构建虚拟环境,模拟文件的创建、删除、移动、搜索等操作,展示了文件系统的基本功能和性能。代码示例演示了这些操作的具体实现,包括文件和目录的创建、移动和删除。文章还讨论了该算法的优势和局限性,如灵活性高但节点移除效率低等问题。
51 0
|
2月前
|
存储 算法 关系型数据库
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
这篇文章主要介绍了多路查找树的基本概念,包括二叉树的局限性、多叉树的优化、B树及其变体(如2-3树、B+树、B*树)的特点和应用,旨在帮助读者理解这些数据结构在文件系统和数据库系统中的重要性和效率。
32 0
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
|
2月前
|
存储 编译器 C++
【初阶数据结构】掌握二叉树遍历技巧与信息求解:深入解析四种遍历方法及树的结构与统计分析
【初阶数据结构】掌握二叉树遍历技巧与信息求解:深入解析四种遍历方法及树的结构与统计分析
|
2月前
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解(三)
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解
|
2月前
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解(二)
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解
|
2月前
|
存储
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解(一)
【高阶数据结构】二叉树进阶探秘:AVL树的平衡机制与实现详解