1. 算法介绍
堆是一种数据结构,可以把堆看成一棵完全二叉树,这棵完全二叉树满足:任何一个非叶结点的值都不大于(或不小于)其左右孩子结点的值。若父亲大孩子小,则这样的堆叫作大顶堆;若父亲小孩子大,则这样的堆叫作小顶堆。
根据堆的定义知道,代表堆的这棵完全二叉树的根结点的值是最大(或最小)的,因此将一个无序序列调整为一个堆,就可以找出这个序列的最大(或最小)值,然后将找出的这个值交换到序列的最后(或最前),这样,有序序列关键字增加1个,无序序列中关键字减少1个,对新的无序序列重复这样的操作,就实现了排序。这就是堆排序的思想。
堆排序中最关键的操作是将序列调整为堆。整个排序的过程就是通过不断调整,使得不符合堆定义的完全二叉树变为符合堆定义的完全二叉树。
2. 执行流程⭐⭐⭐⭐⭐✔
建堆是先从自下而上,从右往左建
初始堆的每一个结点都要满足堆的定义,也就是父节点的值大于左右孩子结点的值!!!
选出最大值,是将根结点和最后一个结点互换,然后继续构建大顶堆!!!
⭐⭐⭐堆顶和最后一个元素交换,才算一趟,也是该趟的最终序列结果!!!
建堆和排序结果是两个阶段,但同属于一趟中。
图示如下:
3. 代码实现
为了三个步骤:
步骤一:先建堆(大根堆或者小根堆)
步骤二:交完堆顶和最后一个元素,然后堆的大小减一
步骤三:向下调整堆
步骤一只需实现一次,步骤二和步骤三循环执行,得到最终的有序序列。
//开始排序:堆排序分为三个功能 ①开始建堆,②交换,③向下调整,重复②和③步 public static void heapSort(int[] array,int len){ int end = len - 1;//确定最后一个结点的下标 createHeap(array);//建堆 //当只剩下一个结点的时候,就不需要交换 while(end > 0){ //交换 swap(array,0,end); //向下调整 shiftDown(array,0,end); //调整完一个结点,下一个 end--; } } //交换数据 public static void swap(int[] array,int i,int j){ int tmp = array[i]; array[i] = array[j]; array[j] = tmp; } //堆排序(大根堆) //从上往下建堆,所以先找父节点,再找孩子结点 public static void createHeap(int[] array){ for(int parent = (array.length - 1 - 1) / 2;parent >= 0;parent--){ shiftDown(array,parent,array.length); } } //向下调整 public static void shiftDown(int[] array,int parent,int len){ //定义一个记录孩子下标的变量(左孩子) int child = 2 * parent + 1; //判断父节点和孩子结点的大小,至少左孩子要存在 while(child < len){ //比较左右孩子 if((child + 1) < len && array[child] < array[child + 1]){ child++; } //判断父节点和孩子节点 if(array[child] > array[parent]){ swap(array,child,parent); parent = child; child = 2 * parent + 1; }else{ break; } } }
public static void main(String[] args) { int[] a = {5,4,3,2,1}; Sort.heapSort(a, a.length); for (int x : a) { System.out.print(x + " "); } }
4. 性能分析
时间辅助度 | 空间复杂度 |
O(N*logN) | O(1) |
数据不敏感 | 数据不敏感 |
稳定性:不稳定。
来上解析,怎么计算这个时间复杂度。
(1)步骤一的时间复杂度:首先知道有N个结点开始建堆,这个时间复杂度就是O(N),大家可以去看看这篇文章,里面有讲建堆的时间复杂度。链接如下:
(2)步骤二和步骤三循环的时间复杂度:那么我第一个结点交换时,需要向下调整为log(N - 1)层;交换第二个结点后,需要向下log(N - 2),接下来就是log(N - 3),log(N - 4),……,log1。所以总的调整次数是log(N - 1) + log(N - 2) + log(N - 3) + log(N - 4) + …… + log1 = log((N - 1)!)。
我们可以在网上看到堆排序的时间复杂度是O(N*logN),这是堆排序的大致估算(我们算时间复杂度都是算个大概),其实log((N - 1)!) 约等于 NlogN。下面是我的证明结果:
① 使用夹逼准则证明:
先求上限:
再求下限:
因为
所以
当 时,
② 则有:
③结论: 既是 的低阶函数,又是 的高阶函数,因此是 的同阶函数!
(3)由于上面的证明步骤,我们可以知道堆排序的时间复杂度是 。