二叉树
二叉树的定义
首先我们准备一颗二叉树:
我们需要定义一些术语,我们所使用的数据结构由结点组成,结点包含的链接可以为空也可以指向其他结点. 在二叉树中,每个结点只能有一个父节点(只有一个例外,也就是根节点,它没有父节点),而且每个结点只有两个链接, 分别指向自己的左子结点和右子结点.尽管链接指向的是结点,但我们可以将每个链接看做指向了另一颗二叉树, 而这棵树的根节点就是被指向的节点.因此,我们可以将二叉树定义为一个空链接 ,或者是一个有左右两个链接的结点,每个链接都指向一颗(独立的)二叉树。----《算法》第四版。
前中后序遍历(这是本篇文章的要讨论的核心问题之一,由前中后序遍历来讨论递归,然后再到荷兰国旗问题和快速排序) 结点代码:
public class TreeNode { int data; TreeNode leftNode; TreeNode rightNode; public TreeNode(int data) { this.data = data; } } 复制代码
二叉树:
public class BinaryTree { TreeNode root; public BinaryTree(TreeNode root) { this.root = root; } /** * 前序遍历 */ public void frontShow(){ } /** * 中序遍历 */ public void middleShow(){ } /** * 后序遍历 */ public void afterShow(){ } } 复制代码
虽然百度不招人喜欢,但是百度百科的一些词条编辑的还是不错的. 从二叉树的递归定义可知,一棵非空的二叉树由根结点及左、右子树这三个基本部分组成。因此,在任一给定结点上,可以按某种次序执行三个操作:
(1) 访问结点本身(N), (2) 遍历该结点的左子树(L), (3) 遍历该结点的右子树(R)。
前序遍历: 根节点 左子树 右子树 中序遍历: 左子树 根节点 右子树 后序遍历: 左子树 右子树 根节点
其实组合的话是有六种的,但是讨论递归的话,前中后序就足够了.
我们现在来任意的给一颗二叉树,不用代码。我们来写出前中后序遍历的结果:
前序遍历: 3 8 5 2 6 1 7 中序遍历: 5 8 2 3 1 6 7 后序遍历: 5 2 8 1 7 6 3
前中后序遍历的进一步解释: 当我到达一个结点,先打印出来,再去访问其他子结点就是前序遍历 当我到达一个结点,不是先打印当前结点,而是接着访问该节点的左子节点,某个节点没有子节点(或者说子结点是null) 我就打印当前节点,这就是中序遍历
以前序遍历为例,我首先打印根节点,然后判断它的左子节点是否为空,如果非空,打印该节点,然后接着进行这样的操作, 翻译成代码就是这样的: 复制代码
在BinaryTree中的代码:
public void frontShow(){ System.out.println(root.data); if (root.leftNode != null){ root.leftNode.frontShow(); } if (root.rightNode != null){ root.rightNode.frontShow(); } } 复制代码
结点中的代码也是这样的,
public void frontShow(){ System.out.println(root.data); if (root.leftNode != null){ root.leftNode.frontShow(); } if (root.rightNode != null){ root.rightNode.frontShow(); } } 复制代码
中后序代码把打印顺序调整一下就可以了,其实这个很好理解,不是多么酷炫的事情. 以下一个问题在我个人看来才是值得值得思考的,就是程序在遍历二叉树的过程,每个节点经过了几次。 其实这个问题,也是十分简单,你按着程序走就可以了.
首先来到3,接着来到8,接着来到5,然后发现5的左右子节点都是空的,然后回到....
这里再介绍另一种在形式上略有不同的前序遍历方式:
public void frontShow(TreeNode root){ if (root == null){ return; } System.out.println(data); frontShow(root.leftNode); frontShow(root.rightNode); } 复制代码
这种形式上的前中后序遍历:
每个节点会到达三次,前序遍历就是第一次碰到的时候打印出来,中序是第二次,后序是第三次 各位有兴致的话可以自己写一写,画一画.
请注意上面那张图,虽然他十分的丑,但是大家不觉得它像一个栈吗? 递归就是程序在帮你压栈.
非递归版
那既然递归是系统在帮你压栈,那非递归版我就自己压栈,不让程序帮我们压栈就可以了吗? 我们先用下图来演示非递归版的遍历:
##从荷兰国旗问题到快速排序
许多时候,问题的规模是会影响我们的判断,为了解决问题,我们可以先把问题的规模先降低到看起来容易解决的地步,再试着去解决问题,如果解决了, 我们再逐步的扩大问题的规模
荷兰国旗问题
荷兰国旗问题: 给定一个数组arr和一个数num,请把小于num的数放在num的左边,大于num的数放在num右边。 等于num的数放在中间
例子: 输入: arr [5,7,5,8,1,9,10] ,num =5 输出: [1, 5, 5, 8, 9, 10, 7]]
思路:
> 准备一个变量less和more。 1. less 区域内(即数组下标 <= less)全部是小于num的,
2. more区域内(即数组下标>more)全部是大于num 3. 我们需要一个变量来帮助我们遍历数组。 在一开始的时候,less = -1 , more = 数组的长度。 这代表刚开始这两个区域还不存在 当arr[curr] < num 的时候, less区域的下一个数和arr[curr]交换。然后less右移一个位置, curr右移一个位置 当arr[curr] > num 的时候, more区域的上一个数和arr[curr]交换。然后more左移一个位置, 此时我们是无法保证从more区域的上一个数,究竟是大于num还是小于num, 因此我们仍然需要将num和这个数进行比较. 以上的思路翻译成代码是用循环来完成的,那么循环结束的条件是什么呢? curr的左侧是less区域, 当排序完成的时候, (less,curr]区域为等于num的区域, 但是当curr + 1 = more 时,这个时候arr[curr+1]还是未进行判断的, 我们仍然需要对arr[curr+1] 和num进行比较
快速排序
那这跟快速排序有什么问题呢?我们来思考一下快速排序(这里讨论是基础版的快速排序)。快速排序是一种分治的排序算法,它将一个数组分成两个子数组,将两部分独立的排序。荷兰国旗就相当于快速排序中的切分过程。快速排序的关键就在于这个切分过程。
快速排序的思想就是:
首先根据num,将数组切分成两个子数组,然后再对这两个子数组进行切分,当子数组的数量小于2,默认数组即为有序。 理解这个切分过程对快速排序来说十分的重要 复制代码
如何证明你的算法的正确性
这也是我在写算法的时候考虑的一个问题, 答案有两种: 1. 严谨一点的话就是数学建模,通过数学来证明你算法的正确性。 2. 利用计算机这个工具来印证我们算法的正确性,意思就是试,找到一个虽然是正确的,但是时间复杂度不那么好的正确算法。 通过随机函数产生大量的样本,比较你的算法和时间复杂度不那么好的正确算法所产生的结果。这种方法
比如说对于排序算法, 首先利用随机函数不断的产生各种各样的数组,并且向数组中填充随机数.
然后将数组复制一份,给正确的算法用
然后比较两个算法的结果.