仅不到五万字轻松了解二叉树和堆 1

简介: 仅不到五万字轻松了解二叉树和堆

文章目录

前言


这里并不可能把所有树的结构都在此篇文章进行详细介绍,我会通过步步延伸的方式去了解树

树 ➡ 二叉树 ➡ 搜索二叉树 ➡ 平衡搜索二叉树 (AVL树和红黑树) ➡ M叉多叉平衡搜索树 (B树和B+树)

一、树概念及结构

💦 树的概念

树是一种非线性的数据结构,它是由 n (n>=0) 个有限结点组成一个具有层次关系的集合。
把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下。

1️⃣ 有一个特殊的结点,称为根结点,根节点没有前驱结点

2️⃣ 除根节点外,其余结点被分为 M (M>0) 个互不相交的集合 T1、T2 … 、Tm,其中每一个集合 Ti (1<=i<=m) 又是一棵结构与树类似的子树,每棵子树的根结点有且只有一个前驱,可以有0个或多个后继

3️⃣ 因此,树是递归定义的

⚠ 注意:树形结构中,子树之间不能有交集,否则就不是树形结构

▶ 子树是不相交的

▶ 除了根节点外,每个节点有且仅有一个父节点

▶ 一棵 N 个节点的树有 N-1 条连

💦 树的相关概念

1️⃣ 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A 的为6

2️⃣ 叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I…等节点为叶节点

3️⃣ 非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G…等节点为分支节点

4️⃣ 双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A 是 B 的父节点

5️⃣ 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B 是 A 的孩子节点

6️⃣ 兄弟节点:具有相同父节点的节点互称为兄弟节点 (这里指的是亲兄弟,而非表堂兄弟); 如上图:B、C 是兄弟节点

7️⃣ 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为 6

8️⃣ 节点的层次:从根开始定义起,根为第 1 层,根的子节点为第 2 层, 以此类推;如上图:树的层次为 4

9️⃣ 树的高度或深度:树中节点的最大层次 (这里有 2 种说法:其一,根算 0,其二,根算 1); 如上图:树的高度为 4

   这里推荐理解其二,因为:

   当要算空树的高度是多少时,按其一的理解,高度是 -1;按其二的理解,高度是 0

   当要算只有一个根节点的树的高度是多少时,按其一的理解,高度是 0;按其二的理解,高度是 1

🔟 堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I 互为兄弟节点

1️⃣1️⃣ 节点的祖先:从根到该节点所经分支上的所有节点;如上图:A 是所有节点的祖先

1️⃣2️⃣ 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是 A 的子孙

1️⃣3️⃣ 森林:由 m(m>0) 棵互不相交的树的集合称为森林,并查集就是一个森林

💦 树的表示

树结构相对线性表就比较复杂了,要存储表示起来比较麻烦,既要保存值域,也要保存结点和结点之间的关系。
实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。

⚠ 对于树的定义其实并不好定义,因为其中有许多未知的因素

1、除非明确说明树的度是多少,比如树的度是 6

struct TreeNode
{
  int data;
  //这种结构其实是很浪费的,因为最大的度是6,但往下可能并没有那么多
  struct TreeNode* subs[6];//指针数组
}

2、如果没有说明树的度是多少,可以使用顺序表存储

struct TreeNode
{
  int data;
  SeqList subs;//顺序表中存储的是节点的指针
  //vector<struct TreeNode*>subs;//在C++学了模板后可以这样定义
}

3、双亲表示法

struct TreeNode
{
  int data;
  struct TreeNode* parent;
}

4、左孩子右兄弟表示法 (比较实用)

typedef int DataTpye;
struct Node
{
  struct Node* _firstChild1;//第一个孩子节点(如有多个孩子,那么只指向最左边的)
  struct Node* _pNextBrother;//指向下一个兄弟节点
  DataType _data;//节点中的数据域
}

💦 树在实际中的运用 (表示文件系统的目录树结构)

    ❗ 以下为 Linux 下的目录树 ❕

二、二叉树概念及结构

💦 二叉树的概念

一棵二叉树是节点的一个有限集合,该集合:
1、或者为空
2、由一个根节点加上两棵别称为左子树和右子树的二叉树组成

1️⃣ 二叉树不存在度大于 2 的结点

2️⃣ 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树

⚠ 注意:对于任意的二叉树都是由以下几种情况复合而成的:

❓ 现实中的存在这种二叉树吗 ❔

   在人为的干涉的情况下一定是存在的,因为没有什么是一电锯解决不了的事

当然也不乏有大自然的鬼斧神工,注意区分普通的树

💦 特殊的二叉树

1️⃣ 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为 K,且结点总数是 2^k - 1,则它就是满二叉树。

2️⃣ 完全二叉树:完全二叉树的前 k - 1 层都满的,第 k 层不一定满 (这就意味着满二叉树是完全二叉树,但完全二叉树不一定是满二叉树),但是从最后一层从左到右必须是连续的,也就是说完全二叉树中度为 1 的节点最少 0 个,最多 1 个。完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为 K 的,有 n 个结点的二叉树,且每个结点都与深度为 K 的满二叉树中编号从 1 至 n 的结点 一一 对应称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

▶ 满二叉树的节点个数就是等比求和

20 + 21 + 22 + … 2(k-1)

利用公式所以满二叉树的节点个数就是 2k - 1

▶ 完全二叉树的节点个数

最多:2^k - 1  这是满二叉树

最少:2(k-1) - 1 + 1  ->  2(k-1)

   2(k-1) - 1 这是前 k-1 层节点的个数,+1 则是第 k 层至少一个

💦 二叉树的性质

1️⃣ 若规定根节点的层数为 1,则一棵非空二叉树的第 i 层上最多有 2^(i-1) 个结点

2️⃣ 若规定根节点的层数为 1,则深度为 h 的二叉树的最大结点数是 2^h - 1

3️⃣ 对任何一棵二叉树, 如果度为 0 其叶结点个数为 n₀, 度为 2 的分支结点个数为 n₂,则有 n₀= n₂+1

4️⃣ 若规定根节点的层数为 1,具有 n 个结点的满二叉树的深度为 h = log₂(n+1)  ps:log₂(n+1)是 log 以 2 为底, n+1 的对数

5️⃣ 对于具有 n 个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从 0 开始编号,则对于序号为 i 的结点有:

  ▶ 若 i>0,i 位置节点的双亲序号:(i-1)/2;i=0,i 为根节点编号,无双亲节点

  ▶ 若 2i+1<n,左孩子序号:2i+1,2i+1>=n 否则无左孩子

  ▶ 若 2i+2<n,右孩子序号:2i+2,2i+2>=n 否则无右孩子

💦 二叉树的概念选择题

1、某二叉树共有 399 个结点,其中有 199 个度为 2 的节点,则该二叉树中的叶子节点数为( )

A. 不存在这样的二叉树

B. 200

C. 198

D. 199

📝 分析:这里的叶子节点就是度为 0 的节点,已知二叉树中度为 2 的节点为 199 个,则度为 0 的节点等于度为 2 的节点 +1,所以选择 B 选项


2、下列数据结构中,不适合采用顺序存储结构的是( )注意此题可以先了解下面的二叉树的存储结构在来做

A. 非完全二叉树

B. 堆

C. 队列

D. 栈

📝 分析:顺序结构存储就是使用数组来存储,它只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。数组只适合存储完全二叉树或者满二叉树。

所以选择 A 选项


3、在具有 2n 个节点的完全二叉树中,叶子节点个数为( )

A. n

B. n+1

C. n-1

D. n/2

📝 分析:

假设度为 0 的个数是 x0,度为 2 的个数是 x2,度为 1 的个数是 x1,那么:

▶ x0 + x1 + x2 = 2n

▶ x0 = x2 + 1

由 x0 = x2 + 1 得到 x2 = x0 - 1

所以 x0 + x1 + x2 = 2n 同 x0 + x1 + x0 - 1 = 2n 同 2x0 + x1 - 1 = 2n

这时再回过头想想完全二叉树中度为 1 的节点最少 0 个,最多就只有 1 个,

所以 x1 = 0 or 1

所以 2x0 + x1 - 1 = 2n 就有 2 种情况:

▶ 2x0 + 0 - 1 = 2n

▶ 2x0 + 1 - 1 = 2n

所以结果一目了然,当 x1 = 0 时,x0为小数,显然不可能;当 x1 = 1 时满足,所以选择 A 选项


4、一棵完全二叉树的节点数为 531 个,那么这棵树的高度为( )

A. 11

B. 10

C. 8

D. 12

📝 分析:

假设完全二叉树的高度是 h,那么:最多有 2^h-1 个节点;最少有 2^(h-1) 个节点

▶ h = 11 时:最多 2047;最少 2014,所以不合理

▶ h = 10 时:最多 1023;最少 512,所以合情合理

▶ h = 8 时:最多 255;最少 128,所以不合理

▶ h = 12 时:最多 4095;最少 2048,所以不合理

所以选择 B 选项


5、一个具有 767 个节点的完全二叉树,其叶子节点个数为 ( )

A. 383

B. 384

C. 385

D. 386

📝 分析:此题类似于第 3 题

假设度为 0 的个数是 x0,度为 2 的个数是 x2,度为 1 的个数是 x1,那么:

▶ x0 + x1 + x2 = 767

▶ x0 = x2 + 1

由 x0 = x2 + 1 得到 x2 = x0 - 1

所以 x0 + x1 + x2 = 767 同 x0 + x1 + x0 - 1 = 767 同 2x0 + x1 - 1 = 767

这时再回过头想想完全二叉树中度为 1 的节点最少 0 个,最多就只有 1 个,

所以 x1 = 0 or 1

所以 2x0 + x1 - 1 = 767 就有 2 种情况:

▶ 2x0 + 0 - 1 = 767

▶ 2x0 + 1 - 1 = 767

所以结果一目了然,当 x1 = 0 时,满足条件;当 x1 = 1 时,不满足条件,所以选择 B 选项

💦 二叉树的存储结构

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构:。

  1️⃣ 顺序存储:顺序结构存储就是使用数组来存储,它只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。如下图所见,数组只适合存储完全二叉树或者满二叉树。

  ❓ 怎么表示下标和树的关系 ❔

     下标表示树中父子关系的公式:

     左孩子和右孩子

       leftchild = parent * 2 + 1

       rightchild = parent * 2 + 2

     父亲 (这里无论是左孩子还是右孩子都适用于以下公式)

       parent = (child - 1) / 2

  2️⃣ 链式存储:二叉树的链式存储结构是指用链表来表示一棵二叉树,即用链表来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链的存储地址。链式结构又分为二叉链和三叉链,现阶段本篇文章我们只了解二叉链,在以后的文章内写到高阶数据结构时,如红黑树等才会用到三叉链。

  ❓ 如何定义二叉链和三叉链 ❔

    二叉链只能通过父亲找孩子,类似于单向链表;而三叉链不仅能通过父亲找孩子,还能通过孩子找父亲,类似于双向链表。

typedef int BTDataType;
//二叉链
struct BinaryTreeNode
{
  struct BinaryTreeNode* _pLeft; //指向当前节点的左孩子
  struct BinaryTreeNode* _pRight; //指向当前节点的右孩子  
  BTDataType _data; //当前节点的值域 
}
//三叉链
struct BinaryTreeNode
{
  struct BinaryTreeNode* _pParent; //指向当前节点的父亲
  struct BinaryTreeNode* _pLeft; //指向当前节点的左孩子
  struct BinaryTreeNode* _pRight; //指向当前节点的右孩子
  BTDataType _data; //当前节点的值域
}


相关文章
|
7月前
【每日一题Day361】LC2558从数量最多的堆取走礼物 | 大顶堆
【每日一题Day361】LC2558从数量最多的堆取走礼物 | 大顶堆
43 0
|
7月前
【每日一题Day179】LC1157子数组中占绝大多数的元素 | 线段树
【每日一题Day179】LC1157子数组中占绝大多数的元素 | 线段树
54 0
|
7月前
|
Java
每日一题《剑指offer》数组篇之把数组排成最小的数
每日一题《剑指offer》数组篇之把数组排成最小的数
44 0
每日一题《剑指offer》数组篇之把数组排成最小的数
【力扣每日一题:2-19】1004. 最大连续1的个数 III【中等】
【力扣每日一题:2-19】1004. 最大连续1的个数 III【中等】
|
算法
【算法挨揍日记】day06——1004. 最大连续1的个数 III、1658. 将 x 减到 0 的最小操作数
1004. 最大连续1的个数 III 题目描述: 给定一个二进制数组 nums 和一个整数 k,如果可以翻转最多 k 个 0 ,则返回 数组中连续 1 的最大个数 。
412 1
|
算法 索引 Cloud Native
【刷题日记】769. 最多能完成排序的块
【刷题日记】769. 最多能完成排序的块
|
Cloud Native Go 索引
【刷题日记】768. 最多能完成排序的块 II
【刷题日记】768. 最多能完成排序的块 II
|
存储 机器学习/深度学习
二叉树详解一万字(基础版)看着一篇就够了(上))
树的结构是一种非线性的数据结构,它是由n(n>=0)个节点组成的一个有层次的关系集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说他是根朝上,而叶朝下。
155 0
Leetcode-每日一题769. 最多能完成排序的块(贪心)
需要怎么分割序列才是个问题,题目其实给了提示因为序列里的数只能是[0, n-1]所以选择[l, r] 连续的序列中的数一定是 [l, r] 这段区间的数字,所以我们只需要遍历数组,去找这段区间内最大的数字,即边界值r,因为他才是决定边界的数字,每次我们到达了r这个位置就表示下一段区间。
68 0
Leetcode-每日一题769. 最多能完成排序的块(贪心)
|
算法 Java
数组中出现次数超过一半的数字(剑指offer39 力扣169)Java哈希表、排序、摩尔投票
数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。