排序算法:堆排序

简介: 关于排序算法中的堆排序的详细介绍,以及实现过程和时间复杂度的计算,附带图解。

 朋友们、伙计们,我们又见面了,本期来给大家解读一下堆的应用--堆排序方面的相关知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成!

数据结构与算法专栏数据结构与算法

个  人  主  页stackY、

C 语 言 专 栏C语言:从入门到精通

目录

 

前言:

1.堆的应用:堆排序

1.1直接使用堆进行插入

1.2向上调整算法建堆

1.3向下调整算法建堆

2.算法时间复杂度

2.1向下调整建堆算法时间复杂度

2.2向上调整建堆的时间复杂度

3.堆排序的时间复杂度

4.完整堆排序代码


紫蓝色几何渐变科技互联网微信公众号封面 (1).gif

前言:

通过前面的学习和了解我们了解到了二叉树使用顺序结构实现的方式为堆,并且对堆的实现都做了详细的介绍,那么本期我们来看看堆到底都有哪些应用场景呢?

堆这个数据结构我们经常使用它来进行堆排序和解决Top-K的问题,本期我们先来重点的了解堆是怎么进行排序的呢?

1.堆的应用:堆排序

前面我们讲到过冒泡排序qsort排序,那么本期再来一种新的排序算法,它的效率也是蛮高的。它所要用到的相关知识点就是数据结构:堆

实现堆排序这里有三种思路:

1. 直接将数组插入到堆中,然后再将堆中的数据插入到数组中。

2. 向上调整算法建堆,然后使用堆删除的思想来排序。

3. 向下调整算法建堆,然后使用堆删除的思想来排序。

1.1直接使用堆进行插入

先创建一个堆,然后将数组中的元素依次插入到堆中,如果是大堆在插入完之后就排序成了降序,然后将堆中的数据依次拷贝到数组中,这样子就完成了排序。

代码演示:

//    堆
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <stdbool.h>
//创建堆
//顺序表
typedef int HPDataType;
typedef struct Heap
{
  HPDataType* a;
  int size;  //有效元素个数
  int capacity;  //容量
}Heap;
//初始化
void HeapInit(Heap* php);
//销毁
void HeapDestroy(Heap* php);
//插入
void HeapPush(Heap* php, HPDataType x);
//删除
void HeapPop(Heap* php);
//判空
bool HeapEmpty(Heap* php);
//获取堆顶元素
HPDataType HeapTop(Heap* php);
//初始化
void HeapInit(Heap* php)
{
  php->a = NULL;
  php->size = 0;
  php->capacity = 0;
}
//销毁
void HeapDestroy(Heap* php)
{
  free(php->a);
  php->a = NULL;
  php->size = php->capacity = 0;
}
//交换函数
void Swap(HPDataType* p1, HPDataType* p2)
{
  HPDataType tmp = *p1;
  *p1 = *p2;
  *p2 = tmp;
}
//向上调整算法
void AdjustUp(HPDataType* a, int child)
{
  //父节点
  int parent = (child - 1) / 2;
  //向上交换
  while (child > 0)
  {
    //判断父子大小关系
    if (a[child] < a[parent])
    {
      //交换
      Swap(&a[child], &a[parent]);
      //更新父子关系
      child = parent;
      parent = (child - 1) / 2;
    }
    else
    {
      break;
    }
  }
}
//插入
void HeapPush(Heap* php, HPDataType x)
{
  assert(php);
  //插入数据的过程
  //容量不够则需要扩容
  //判断空间是否不足
  if (php->size == php->capacity)
  {
    int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;
    //为堆开辟空间
    HPDataType* tmp = (HPDataType*)realloc(php->a, sizeof(HPDataType) * newcapacity);
    if (tmp == NULL)
    {
      perror("realloc fail");
      return;
    }
    php->capacity = newcapacity;
    php->a = tmp;
  }
  //插入数据
  php->a[php->size] = x;
  php->size++;
  //向上调整
  AdjustUp(php->a, php->size - 1);
}
//向下调整
void AdjustDown(HPDataType* a, int n, int parent)
{
  //假设左孩子为左右孩子中最小的节点
  int child = parent * 2 + 1;
  while (child < n)  //当交换到最后一个孩子节点就停止
  {
    if (child + 1 < n  //判断是否存在右孩子
      && a[child + 1] < a[child]) //判断假设的左孩子是否为最小的孩子
    {
      child++;   //若不符合就转化为右孩子
    }
    //判断孩子和父亲的大小关系
    if (a[child] < a[parent])
    {
      Swap(&a[child], &a[parent]);
      //更新父亲和孩子节点
      parent = child;
      child = parent * 2 + 1;
    }
    else
    {
      break;
    }
  }
}
//删除
void HeapPop(Heap* php)
{
  assert(php);
  //判断堆是否为空
  assert(!HeapEmpty(php));
  //交换堆顶的数据和最后的数据
  Swap(&php->a[0], &php->a[php->size - 1]);
  //删除最后的数据
  php->size--;
  //向下调整
  AdjustDown(php->a, php->size, 0);
}
//判空
bool HeapEmpty(Heap* php)
{
  assert(php);
  return php->size == 0;
}
//获取堆顶元素
HPDataType HeapTop(Heap* php)
{
  assert(php);
  //判断堆是否为空
  assert(!HeapEmpty(php));
  return php->a[0];
}
//堆排序
void HeapSort(int* a, int n)
{
  //建堆
  Heap hp;
  HeapInit(&hp);
  //将数组先插入到堆中实现堆中的大小堆排序
  for (int i = 0; i < n; i++)
  {
    HeapPush(&hp, a[i]);
  }
  //再将堆中的数据拷贝到数组中
  int i = 0;
  while (!HeapEmpty(&hp))
  {
    //保存堆顶元素
    int top = HeapTop(&hp);
    //拷贝
    a[i++] = top;
    HeapPop(&hp);
  }
  HeapDestroy(&hp);
}
int main()
{
  int a[] = { 5,6,8,9,7,4,5,2,3,6 };
  int sz = sizeof(a) / sizeof(int);
  HeapSort(a, sz);
  return 0;
}
image.gif

我们在这里建的是小堆,所以是排成了升序的状态,建大堆只要将向上调整和向下调整的小于号换成大于号即可。

image.gif编辑

这种算法有点弊端:

1. 必须先要有一个堆,太麻烦。

2. 将数组的数据拷贝至堆,又将堆的数据拷贝至数组,空间复杂度上面代价有点大。

但是这种算法的时间复杂度也是不错的,在前面我们讲堆的时候提到过向上调整算法和向下调整算法,这两种算法的时间复杂度都是O(logN),那么在这个堆排序的算法中的时间复杂度加上遍历数组的时间复杂度合起来为O(N*logN)

1.2向上调整算法建堆

在使用向上调整算法和向下调整算法的时候如果要达到降序的目的应该建大堆还是小堆?如果要达到升序的目的应该建大堆还是小堆?

我们在这里来思考一下:

按照以往的思路:要排成降序需要建大堆,这样就保证了最大的一个在堆顶,然后将除了堆顶剩下的数据看作一个堆,再找到次大的,这时就面临两个问题:

1. 将剩下的数据看作一个堆时又需要重新建堆,代价有点大。

2. 如果将剩下的数据重新建堆,那么它们原来的父子关系就乱套了,从之前的兄弟变成父子或许有点扯淡。

那么我们就来换一种思路,这种思路和删除数据时的思路一样,我们要排成降序我们就建小堆,那么这时堆顶的数据就是最小的,然后将堆顶的数据和最后一个数据交换,这时堆的最后一个数据就是最小的,此时,就不需要将最后一个数据看作堆中的数据,然后再对剩余数据进行向下调整再找出次小的,再交换至倒数第二个位置......这样子依次类推,直到全部找出来。同样的,要排成升序就建大堆,找出最大的交换,再找次大的,再交换......依次类推同样也可以完成升序。

这里还有需要注意的一个点,我们要从哪里开始进行向上调整建堆?之前说过向上调整算法调整的节点的上面必须是一个堆,因此我们需要从第一个结点开始进行向上调整建堆,因为第一个结点就是一个堆,所以我们将第一个结点看作堆,然后从第二个位置开始插入,前面的结点是堆,符合。

代码演示:

//交换函数
void Swap(int* p1, int* p2)
{
  int tmp = *p1;
  *p1 = *p2;
  *p2 = tmp;
}
//向上调整算法
void AdjustUp(int* a, int child)
{
  //父节点
  int parent = (child - 1) / 2;
  //向上交换
  while (child > 0)
  {
    //判断父子大小关系
    if (a[child] < a[parent])
    {
      //交换
      Swap(&a[child], &a[parent]);
      //更新父子关系
      child = parent;
      parent = (child - 1) / 2;
    }
    else
    {
      break;
    }
  }
}
//向下调整
void AdjustDown(int* a, int n, int parent)
{
  //假设左孩子为左右孩子中最小的节点
  int child = parent * 2 + 1;
  while (child < n)  //当交换到最后一个孩子节点就停止
  {
    if (child + 1 < n  //判断是否存在右孩子
      && a[child + 1] < a[child]) //判断假设的左孩子是否为最小的孩子
    {
      child++;   //若不符合就转化为右孩子
    }
    //判断孩子和父亲的大小关系
    if (a[child] < a[parent])
    {
      Swap(&a[child], &a[parent]);
      //更新父亲和孩子节点
      parent = child;
      child = parent * 2 + 1;
    }
    else
    {
      break;
    }
  }
}
void HeapSort(int* a, int n)
{
  //建堆--向上调整算法建堆
  //模拟的是一个插入堆的过程
  for (int i = 1; i < n; i++)
  {
    AdjustUp(a, i);
  }
  int end = n - 1;
  while (end > 0)
  {
    //交换堆顶和最后一个数据的位置
    Swap(&a[0], &a[end]);
    //向下调整,找次小的
    AdjustDown(a, end, 0);
    end--;
  }
}
int main()
{
  int a[] = { 5,6,8,9,7,4,5,2,3,6 };
  int sz = sizeof(a) / sizeof(int);
  HeapSort(a, sz);
  return 0;
}
image.gif

我们在这里建的是小堆,所以是排成了降序的状态,建大堆只要将向上调整和向下调整的小于号换成大于号即可。

image.gif编辑

1.3向下调整算法建堆

排降序建小堆,排升序建大堆,当我们使用向上调整算法来建堆实现堆排序时,需要用到向上调整算法和向下调整算法,这个有点太麻烦,那既然在交换数据之后要进行向下调整,那不妨直接使用向下调整算法来直接建堆。

向下调整算法使用的前提是向下调整的结点的下面必须是堆,我们不妨画图来观察一下:

我们知道一个叶子节点本身就是大堆或者小堆,因此我们可以在叶子节点上面下下功夫。

向下调整算法的下面必须是堆:

而叶子节点恰好又是堆,那么叶子节点就可以不用处理,那么我们就可以倒着来进行建堆,从最后一个非叶子节点开始调整倒数第一个叶子节点的父亲开始调整)。根据孩子与父亲的关系找到父亲然后调整建堆,由于叶子节点本身就是堆,从它的父亲开始调整也符合向下调整算法的逻辑。

image.gif编辑

代码演示:

//交换函数
void Swap(int* p1, int* p2)
{
  int tmp = *p1;
  *p1 = *p2;
  *p2 = tmp;
}
//向下调整
void AdjustDown(int* a, int n, int parent)
{
  //假设左孩子为左右孩子中最小的节点
  int child = parent * 2 + 1;
  while (child < n)  //当交换到最后一个孩子节点就停止
  {
    if (child + 1 < n  //判断是否存在右孩子
      && a[child + 1] < a[child]) //判断假设的左孩子是否为最小的孩子
    {
      child++;   //若不符合就转化为右孩子
    }
    //判断孩子和父亲的大小关系
    if (a[child] < a[parent])
    {
      Swap(&a[child], &a[parent]);
      //更新父亲和孩子节点
      parent = child;
      child = parent * 2 + 1;
    }
    else
    {
      break;
    }
  }
}
void HeapSort(int* a, int n)
{
  //建堆--向下调整算法建堆
  for (int i = ((n - 1) - 1) / 2; i >= 0; --i)
  {//       这里的n-1表示最后一个叶子节点
    //       最后一个叶子节点的父亲就是:
    //           (n-1)-1 /2;
    AdjustDown(a, n, i);
  }
  int end = n - 1;
  while (end > 0)
  {
    //交换堆顶和最后一个数据的位置
    Swap(&a[0], &a[end]);
    //向下调整,找次小的
    AdjustDown(a, end, 0);
    end--;
  }
}
int main()
{
  int a[] = { 5,6,8,9,7,4,5,2,3,6 };
  int sz = sizeof(a) / sizeof(int);
  HeapSort(a, sz);
  return 0;
}
image.gif

2.算法时间复杂度

一个算法的好与坏取决与它的时间和空间,那么对于向上调整建堆和向下调整建堆哪种方法的时间复杂度更优呢?我们可以一一来计算一下。

2.1向下调整建堆算法时间复杂度

image.gif编辑

假设二叉树的高度为h,总结点个数为N

第1层: 有2^0个节点,需要向下挪动h-1次

第2层: 有2^1个节点,需要向下挪动h-2次

第3层: 有2^2个节点,需要向下挪动h-3次

......

第h-1层: 有2^(h-2)个节点,需要向下挪动1次

第h层: 有2^(h-1)个节点,需要向下挪动0次

总共合计需要挪动:

F(h) = 2^(h-2) * 1 + 2^(h-3) * 2 + ...... + 2^1 * (h-2) + 2^0 * (h-1)

使用错位相减法:

2F(h) = 2^(h-1) * 1 + 2^(h-2) * 2 + 2^(h-3) * 2 + ...... + 2^2 * (h-2) + 2^1 * (h-1)

-

 F(h) =                      2^(h-2) * 1 + 2^(h-3) * 2 + ...... + 2^1 * (h-2) + 2^0 * (h-1)

     

F(h)  = 2^h - 1 - h

image.gif编辑这棵树的中的节点的个数为N = 2^h-1 ==>  h = log(N+1)

F(N) = N - log(N+1)

因此向下调整算法的时间复杂度为O(N)

image.gif编辑

2.2向上调整建堆的时间复杂度

image.gif编辑

向上调整很明显就是一个多乘多的问题,单单只看最后一层,节点越多,调整的次数越多,那这就完蛋了,向下调整算法最后一层的节点时不需要调整的,那这就很明显了,向下调整算法明显优势于向上调整算法,那么到底能快多少呢?我们一起来计算一下:

假设二叉树的高度为h,总结点个数为N

第1层: 有2^0个节点,需要向下挪动0次

第2层: 有2^1个节点,需要向下挪动1次

第3层: 有2^2个节点,需要向下挪动2次

......

第h-1层: 有2^(h-2)个节点,需要向下挪动h-2次

第h层: 有2^(h-1)个节点,需要向下挪动h-1次

总共合计需要挪动:

F(h) = 2^1 * 1 + 2^2 * 2 + ...... + 2^(h-2) * (h-2) + 2^(h-1) * (h-1)

使用错位相减法:

2F(h) =                  2^2 * 1 + 2^3 * 2 + ...... + 2^(h-1) * (h-2) + 2^h * (h-1)

-

F(h) =   2^1 * 1 + 2^2 * 2 + ...... + 2^(h-2) * (h-2) + 2^(h-1) * (h-1)

F(h) = 2^1 * 1 + 2^2 * 2 + ...... + 2^(h-2) * (h-2) + 2^(h-1) * (h-1)

      = - 2^1 - 2^2 - 2^3 - ...... - 2^(h-2) - 2^(h-1) + 2^h * (h-1)

      = - 2^h + 2 - 2^h + 2^h * h

      = 2^h * (h-2) + 2

image.gif编辑

这棵树的中的节点的个数为N = 2^h-1 ==>  h = log(N+1)

F(N) = (N + 1) * (log(N + 1) - 2) + 2

因此向上调整算法的时间复杂度为O(N * logN)

image.gif编辑

3.堆排序的时间复杂度

计算出了向下调整建堆的时间复杂度,我们再来看看堆排序算法的整体的时间复杂度。

这时我们就要计算筛选数据操作时的交换数据和向下调整的时间复杂度:

image.gif编辑

这里为什么最上面的反而不用向下调整那么多次了,是因为在调整上面的数据时,下面的数据已经是一个堆了,所以筛选数据的过程就和向上调整建堆的时间复杂度一样。

时间复杂度是O(N * logN )

那么再加上向下调整建堆的时间复杂度就是O(N) + O(N * logN)

所以整个堆排序算法的时间复杂度为O(N * logN)

4.完整堆排序代码

//交换函数
void Swap(int* p1, int* p2)
{
  int tmp = *p1;
  *p1 = *p2;
  *p2 = tmp;
}
//向下调整
void AdjustDown(int* a, int n, int parent)
{
  //假设左孩子为左右孩子中最小的节点
  int child = parent * 2 + 1;
  while (child < n)  //当交换到最后一个孩子节点就停止
  {
    if (child + 1 < n  //判断是否存在右孩子
      && a[child + 1] < a[child]) //判断假设的左孩子是否为最小的孩子
    {
      child++;   //若不符合就转化为右孩子
    }
    //判断孩子和父亲的大小关系
    if (a[child] < a[parent])
    {
      Swap(&a[child], &a[parent]);
      //更新父亲和孩子节点
      parent = child;
      child = parent * 2 + 1;
    }
    else
    {
      break;
    }
  }
}
//O(N * logN)
void HeapSort(int* a, int n)
{
  //建堆--向下调整算法建堆
  //时间复杂度为O(N)
  for (int i = ((n - 1) - 1) / 2; i >= 0; --i)
  {//       这里的n-1表示最后一个叶子节点
    //       最后一个叶子节点的父亲就是:
    //           (n-1)-1/2;
    AdjustDown(a, n, i);
  }
  //O(N * logN)
  int end = n - 1;
  while (end > 0)
  {
    //交换堆顶和最后一个数据的位置
    Swap(&a[0], &a[end]);
    //向下调整,找次小的
    AdjustDown(a, end, 0);
    end--;
  }
}
int main()
{
  int a[] = { 5,6,8,9,7,4,5,2,3,6 };
  int sz = sizeof(a) / sizeof(int);
  HeapSort(a, sz);
  return 0;
}
image.gif

朋友们、伙计们,美好的时光总是短暂的,我们本期的的分享就到此结束,最后看完别忘了留下你们弥足珍贵的三连喔,感谢大家的支持!

目录
相关文章
|
3月前
|
算法 Python
数据结构算法--4堆排序
堆排序过程概述:建立大根堆,将堆顶最大元素移出并替换为末尾元素,调整保持堆性质,重复此过程直至堆为空,实现排序。时间复杂度为O(nlogn)。Python中可用heapq模块进行堆操作。
|
4月前
|
机器学习/深度学习 人工智能 算法
数据结构与算法:堆排序和TOP-K问题
朋友们大家好,本节内容来到堆的应用:堆排序和topk问题
数据结构与算法:堆排序和TOP-K问题
|
4月前
|
存储 人工智能 算法
深入浅出堆排序: 高效算法背后的原理与性能
深入浅出堆排序: 高效算法背后的原理与性能
93 1
|
4月前
|
移动开发 算法 前端开发
前端算法之堆排序
前端算法之堆排序
33 1
|
3月前
|
搜索推荐 算法 Java
Java中的快速排序、归并排序和堆排序是常见的排序算法。
【6月更文挑战第21天】Java中的快速排序、归并排序和堆排序是常见的排序算法。快速排序采用分治,以基准元素划分数组并递归排序;归并排序同样分治,先分割再合并有序子数组;堆排序通过构建堆来排序,保持堆性质并交换堆顶元素。每种算法各有优劣:快排平均高效,最坏O(n²);归并稳定O(n log n)但需额外空间;堆排序O(n log n)且原地排序,但不稳定。
35 3
|
3月前
|
搜索推荐 算法
【C/排序算法】:堆排序和选择排序
【C/排序算法】:堆排序和选择排序
25 0
|
3月前
|
存储 算法 C语言
数据结构和算法——堆排序(选择排序、思路图解、代码、时间复杂度、堆排序及代码)
数据结构和算法——堆排序(选择排序、思路图解、代码、时间复杂度、堆排序及代码)
29 0
|
4月前
|
人工智能 搜索推荐 算法
sort-04-heap sort 堆排序算法详解
这是一个关于排序算法的系列文章摘要,包括了10篇关于不同排序算法的链接,如冒泡排序、快速排序、选择排序、堆排序等。堆排序是一种基于比较的排序算法,利用了近似完全二叉树的结构并满足最大堆或最小堆的性质。最大堆中,每个节点的值都大于或等于其子节点。文章详细解释了最大堆的概念、节点访问方式以及堆的操作,包括堆调整和堆排序的过程,并通过图解展示了堆排序的具体步骤。此外,还提供了一个Java实现的堆排序代码示例。整个排序系列来源于一个开源项目,读者可以通过链接查看完整内容。
sort-04-heap sort 堆排序算法详解
|
4月前
|
算法 搜索推荐
数据结构与算法⑫(第四章_中_续一)堆排序(详解)
数据结构与算法⑫(第四章_中_续一)堆排序(详解)
38 0
|
4月前
|
人工智能 算法 搜索推荐
直接插入排序、希尔排序、直接选择排序、堆排序、冒泡排序——“数据结构与算法”
直接插入排序、希尔排序、直接选择排序、堆排序、冒泡排序——“数据结构与算法”