树形结构
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
- 有一个特殊的结点,称为
根结点
,根结点没有前驱结点 - 除根结点外,其余结点被分成M(M > 0)个互不相交的集合T1、T2、…、Tm,其中每一个集合Ti (1 <= i <= m) 又是一棵与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
- 树是递归定义的。
- 子树是不相交的
- 除了根节点以外,每个节点有且只有
一个
父节点 - 一颗
N
个节点的树有N-1
条边
概念
- 结点的度:一个结点含有子树的个数称为该结点的度; 如上图:A的度为6
- 树的度:一棵树中,所有结点度的最大值称为树的度; 如上图:树的度为6
- 叶子结点或终端结点:度为0的结点称为叶结点;如上图:B、C、H、I…等节点为叶结点
- 双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点;如上图:A是B的父结点
- 孩子结点或子结点:一个结点含有的子树的根结点称为该结点的子结点;如上图:B是A的孩子结点
- 根结点:一棵树中,没有双亲结点的结点;如上图:A
- 结点的层次:从根开始定义起,根为第1层,根的子结点为第2层,以此类推
- 树的高度:树中结点的最大层次;如上图:树的高度为4
树的以下概念只需了解,在看书时只要知道是什么意思即可:
- 非终端结点或分支结点:度不为0的结点;如上图:D、E、F、G…等节点为分支结点
- 兄弟结点:具有相同父结点的结点互称为兄弟结点;如上图:B、C是兄弟结点
- 堂兄弟结点:双亲在同一层的结点互为堂兄弟;如上图:H、I互为兄弟结点
- 结点的祖先:从根到该结点所经分支上的所有结点;如上图:A是所有结点的祖先
- 子孙:以某结点为根的子树中任一结点都称为该结点的子孙。如上图:所有结点都是A的子孙
- 森林:由m(m>=0)棵互不相交的树组成的集合称为森林
树的表示形式
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,实际中树有很多种表示方式,如:双亲表示法, 孩子表示法、孩子双亲表示法、孩子兄弟表示法等等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
class Node{ int value; //树中存储的数据 Node firstChild; //第一个孩子引用 Node nextBrother; //下一个兄弟引用 }
树的应用
文件管理系统(目录和文件)
二叉树
概念
一棵二叉树是结点的一个有限集合,该集合:
- 或者为空
- 或者是由一个根节点加上两棵别称为左子树和右子树的二叉树组成。
从上图可以看出:
- 二叉树不存在度大于 2 的结点,即每一个节点最多只能有两个子节点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
两种特殊的二叉树
- 满二叉树: 一棵二叉树,如果每层的结点数都达到最大值,则这棵二叉树就是满二叉树。也就是说,如果一棵二叉树的层数为
K
,且结点总数是 2 k − 1 ,则它就是满二叉树。 - 完全二叉树: 完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。要求从上到下,从左到右依次放。
满二叉树是一种特殊的完全二叉树
二叉树的性质
- 度为 0 的节点会比度为 2 的节点多一个
如何求节点
- 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为多少?
199+1 = 200 个节点
- 在具有 2n 个结点的完全二叉树中,叶子结点个数为多少?
- 一个具有767个节点的完全二叉树,其叶子节点个数为多少?
- 一棵完全二叉树的节点数为531个,那么这棵树的高度为多少?
性质 4, l o g 2 ( 531 + 1 ) = n log_2(531+1) = n log2(531+1)=n 向上取整, n = 10 n=10 n=10
二叉树的存储
二叉树的存储结构分为:顺序存储和类似于链表的链式存储
- 顺序存储是用数组存二叉树
- 链式存储
二叉树的链式存储是通过一个一个节点引用起来的,常见的表示方式有二叉和三叉表示方式,具体如下:
//孩子表示法,一般使用这种 class Node { int val; //数据域 Node left; //左孩子的引用,常代表左孩子为根的整棵左子树 Node right; //右孩子的引用,常常代表右孩子为根的整棵右子树 } //孩子双亲表示法 class Node { int val; // 数据域 Node left; // 左孩子的引用,常常代表左孩子为根的整棵左子树 Node right; // 右孩子的引用,常常代表右孩子为根的整棵右子树 Node parent; // 当前节点的根节点 }
二叉树的基本操作
二叉树的遍历
前面学习过的链表,其实本质上都是在按照我们的遍历来完成的(遍历这个链表,找到对应的节点、找到尾巴等等)
任何一颗二叉树就分为两部分:
- 根节点
- 左右子树,再里面又分为根节点、左右子树
二叉树的遍历总共有四种,每一种都是沿着某条路线进行的:
- 前序遍历,根—>左—>右,上图打印结果为:ABDCEF
- 中序遍历,左—>根—>右,上图打印结果为:DBAECF
- 后序遍历,左—>右—>根,上图打印结果为:DBEFCA
- 层序遍历,从上到下,从左到右,依次遍历,上图打印结果为:ABCDEF
它们的遍历打印结果是不一样的,因为他们访问根的形式和时间都不一样
代码的实现
对下面这颗树进行遍历的代码实现:
前序遍历:ABDEHCFG
中序遍历:DBEHAFCG
后序遍历:DHEBFGCA
构造树
用一个内部类来定义 TreeNode
public class TestBinaryTree { static class TreeNode { public int val; public TreeNode left; public TreeNode right; public TreeNode(char val) { this.val = val; } } public TreeNode creatTree() { TreeNode A = new TreeNode('A'); TreeNode B = new TreeNode('B'); TreeNode C = new TreeNode('C'); TreeNode D = new TreeNode('D'); TreeNode E = new TreeNode('E'); TreeNode F = new TreeNode('F'); TreeNode G = new TreeNode('G'); TreeNode H = new TreeNode('H'); A.left = B; A.right = C; B.left = D; B.right = E; C.left = F; C.right = G; E.right = H; return A; //根节点 } }
三种遍历方法
以前序遍历
为例子进行详细解释:
任何一颗子树都是以:根—>左—>右进行遍历的,这个过程是一个不断递归的过程
- 一切的前提是当访问的根节点为
null
时,就返回 - 因为是根最先遍历,所以最先就是直接打印根的值
- 然后再向左子树进行遍历
- 直到访问到的左子树此时的根节点为
null
,就掉头
- 就对右子树进行遍历
- 直到访问到的右子树此时的根节点位
null
,就掉头
- 执行到“
}
”时,就是一个递归方法结束,开始调用下一个
三种遍历的代码:
// 前序遍历 void preOrder(TreeNode root){ if(root == null){ return; } //直接打印根节点 System.out.print(root.val+" "); //递归遍历左子树 preOrder(root.left); //递归遍历右子树 preOrder(root.right); } // 中序遍历 public void inOrder(TreeNode root) { if(root == null){ return; } //递归遍历左子树 inOrder(root.left); //打印此时根节点的值 System.out.print(root.val+" "); //递归遍历右子树 inOrder(root.right); } // 后序遍历 public void postOrder(TreeNode root) { if(root == null){ return; } postOrder(root.left); postOrder(root.right); System.out.print(root.val+" "); }
遍历相关题目
- 某完全二叉树按层次输出(同一层从左到右)的序列为 ABCDEFGH 。该完全二叉树的前序序列为?
我们画出这棵树:
所以它的前序序列是:ABDHECFG
- 二叉树的先序遍历和中序遍历如下:先序遍历:EFHIGJK;中序遍历:HFIEJKG。则二叉树的后序序列为?
我们画出这棵树:
所以它的后序序列是:HIFKJGE
- 设一课二叉树的中序遍历序列:badce,后序遍历序列:bdeca,则二叉树前序遍历序列为?
我们画出这棵树:
所以它的前序序列为:abcde
只根据前序和后序无法画出二叉树,因为只有中序才能确定左子树和右子树的范围
- 某二叉树的后序遍历序列与中序遍历序列相同,均为 ABCDEF ,则按层次输出(同一层从左到右)的序列为
我们画出这棵树:
所以它的层次序列为:FEDCBA
二叉树的基本操作
获取节点个数
方法一:子问题思路/递归思路
节点个数 = 左子树节点个数 + 右子树节点个数 + 1
- 左子树节点个数 = 左子树的左子树节点个数 + 左子树的右子树节点个数 + 1
- 右子树节点个数 = 右子树的左子树节点个数 + 右子树的右子树节点个数 + 1
/*子问题思路,递归思路*/ public int size(TreeNode root) { if(root == null){ return 0; } //节点个数 = 左子树节点个数 + 右子树节点个数 + 1 int ret = size(root.left) + size(root.right) + 1; return ret; }
方法二:遍历思路
- 因为
root
将遍历每一个节点,所以当root
每次遍历到不同的节点时,nodeSize
就++
/*遍历思路*/ public static int nodeSize; public void size2(TreeNode root) { if(root == null){ return; } nodeSize++; //左树中的节点 size2(root.left); //右树中的节点 size2(root.right); }
获取叶子节点的个数
方法一:子问题思路/递归思路
整棵树的叶子节点个数 = 左子树的叶子节点 + 右子树的叶子节点
/** * 子问题思路 * 求叶子节点的个数 */ public int getLeafNodeCount(TreeNode root){ if(root == null){ return 0; } if(root.left == null && root.right == null){ return 1; } return getLeafNodeCount(root.left) + getLeafNodeCount(root.right); }
方法二:遍历思路
- 以某种方式遍历这棵树,只要发现是叶子就++
/** * 遍历思路 * 求叶子节点个数 */ public int leafSize; public void getLeafNodeCount2(TreeNode root){ if(root == null){ return; } if(root.left == null && root.right == null){ leafSize++; } getLeafNodeCount(root.left); getLeafNodeCount(root.right); }
获取第 K 层节点个数
第 k
层节点个数 = 左子树的 k-1
层节点个数 + 右子树的 k-1
层节点个数
- 左子树的
k-1
层节点个数 = 左子树的左子树的k-2
层节点个数 + 左子树的右子树的k-2
层节点个数 - …
//第k层有多少个节点 public int getKLevelNodeCount(TreeNode root, int k) { if(root == null){ return 0; } if(k == 1){ return 1; } return getKLevelNodeCount(root.left,k-1) + getKLevelNodeCount(root.right,l-1); }
获取二叉树的高度
树的高度 = { 左树高度,右树高度 } m a x + 1
root 下来之后,每次都是取左右两边更高的那一个,再+1 递归上去
//获取二叉树的高度 public int getHight(TreeNode root) { if(root == null){ return 0; } int leftHight = getHight(root.left); int rightHight = getHight(root.right); return leftHight > rightHight ? leftHight + 1 : rightHight + 1; }