一、树概念及结构
树是一种非线性的数据结构,它是由n(n>=0)
个有限节点组成一个具有层次关系的集合,然而树在实践中价值不大,但是二叉树实践价值比较大(这种集合称为树的理由,是它是根朝上,而叶朝下,看起来很像树)
- 有一个特殊的节点,称为根节点,根节点没有前驱节点
- 除根节点外,其余节点被分成
M(M>0)
个互不相交的集合T1、T2、....、Tm
,其中每一个集合Ti(1<=i<=m)
又是一颗结构与树类似的子树。每颗子树的根节点有且只有一个前驱,可有0个或多个后继。 - 树是递归定义,与此同时需要注意。在树形结构中子树之间不能有交集,否则就不是树形结构
1.1 树的相关概念
- 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
- 叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I…等节点为叶节点
- 非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G…等节点为分支节点
- 双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
- 兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
- 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
- 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推
- 树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
- 堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
- 节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
- 森林:由m(m>0)棵互不相交的树的集合称为森林
二、树的存储表示
由于树状结构相对线性表复杂,存储方式也更加麻烦,既要保存值域,也要保存好结点和结点之间的关系。
以下根据之前知识得到的几种方法
- 每个孩子都有一个地址,可以通过指针数组存储数据(空间是固定,申请新空间有代价和空间情况问题出现)
- 对于第一种方法优化,将指针数组改用为顺序表存储孩子,解决了空间固定的问题
- 推荐常用的解法:左孩子右兄弟法(老大带着老二,老二带着老三,不用双亲累)
typedef int DataType; struct Node { struct Node* _firstChild1; // 第一个孩子结点 struct Node* _pNextBrother; // 指向其下一个兄弟结点 DataType _data; // 结点中的数据域 };
当然不局限以上几种方式,还有双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法
三、二叉树概念
一颗二叉树是节点的一个有限集合,该集合可能有两种情况
- 空树
- 由一个根节点加上两颗别称为左子树和右子树的二叉树组成(子树可能为空树)
从图中可以得出两个结论:
- 二叉树不存在度大于2的结点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是通过下列几种情况组成的(空树的情况最容易忘记)
3.1 现实中的二叉树(见到都要拜几下)
四、特殊的二叉树
- 满二叉树:一个二叉树,如果每一个层的节点数都达到最大值,则这个二叉树为满二叉树。换言之一个二叉树的层次为K,且节点总数是2K-1,则它就是满二叉树
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出的。对于高度为K,有n个节点的二叉树,当且仅当每一个节点都与高度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。
简单概括下:
- 满二叉树的每一层都是满的
- 完全二叉树如果高度是n,那么前n-1个是满的,最后一层不一定满,但是从左到右必须是连续
- 完全二叉树是效率很高的数据结构,满二叉树是一种特殊的完全二叉树
- 满二叉树是完全二叉树的充分必要条件
4.1 不属于完全二叉树的情况
这种就是普通的二叉树,从左到右不是连续的。
五、二叉树的存储结构
二叉树一般可以使用两种结构存储,一种是顺序结构,一种链式结构
5.1 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是满二叉树会有空间的浪费,对此现实中使用中只有堆才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树,在接下来做题我们需要根据物理上是数组,逻辑上是二叉树配合去解出一道题目。
5.2 父子节点间下标规律关系(重要)
leftchild = parent * 2 + 1;
rightchild = paretn * 2 +2;
parent = (child - 1) / 2;
(不区分左右孩子)- 对于第三点,个人推理下,
leftchild
下标拆为leftchild- 1
和1
,对于leftchild-1
为parent
下标两倍,对于(child - 1) / 2
运算将leftchild
拆出来为1
部分单独除于2取整数为0,leftchild -1
部分可以看成leftchild
,而且rightchild与leftchild相差1
,由于rightchild = leftchild - 1
和通过上面leftchild - 1 ~= leftchild
,可以推理出rightchild = leftchild(在进行/2运算,取整数情况下)
5.3 链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面学到高阶数据结构如红黑树等会用到三叉链
typedef int BTDataType; // 二叉链 struct BinaryTreeNode { struct BinTreeNode* _pLeft; // 指向当前节点左孩子 struct BinTreeNode* _pRight; // 指向当前节点右孩子 BTDataType _data; // 当前节点值域 } // 三叉链 struct BinaryTreeNode { struct BinTreeNode* _pParent; // 指向当前节点的双亲 struct BinTreeNode* _pLeft; // 指向当前节点左孩子 struct BinTreeNode* _pRight; // 指向当前节点右孩子 BTDataType _data; // 当前节点值域 };
5.4 小总结
顺序结构存储就是通过数组进行存储,一般使用数组只适合完全二叉树,非完全二叉树就不适合数组结构存储,普通二叉树只适合链式结构存储。但是在现实中使用堆才会使用数组来存储,大部分还是通过链式结构存储。
原因在于:
- 首先我们要知道,二叉树拥有其特殊的逻辑结构,不同于其他数据结构适合堆数据的增删查改,因为在于开辟的空间消耗大,逻辑也更加复杂,如果使用如此复杂的结构去存储数据,不是没有多少价值的,这样子不如一开始就采用顺序表进行存储数据。同时一般而言,二叉树的结构是递归式,用非递归实现更加麻烦,
- 普通二叉树中可能存储元素密度很低,连续存储的结构会造成大量的空间浪费
- 堆是根据"堆属性"来排序,"堆属性"决定了树中结点的位置(在下面堆的介绍有说明)