排序算法(五):堆排序

简介: 从二叉搜索树和平衡二叉树的介绍中,可以发现二叉树这种结构具有一个很好的特性,当有序的二叉树构造完成之后,更改树中节点后,只需要 的时间复杂度即可将二叉树重新调整为有序状态。

二叉搜索树平衡二叉树的介绍中,可以发现二叉树这种结构具有一个很好的特性,当有序的二叉树构造完成之后,更改树中节点后,只需要 O(log_2N) 的时间复杂度即可将二叉树重新调整为有序状态。若构造出一种具有特殊节点顺序的二叉树,使得每次对二叉树执行插入或删除节点操作后,都调整保持二叉树根节点的值为树中节点的极值,则 N 个元素的集合,构造出这种二叉树后,只需要对树执行 N-1 次的取根节点操作,即可获得一个有序序列。整个取节点加调整操作的时间复杂度为 O(Nlog_2N),若构造这种二叉树的时间复杂度不高于 O(Nlog_2N),则采用构造这种二叉树的方式来完成排序的时间复杂度为 O(Nlog_2N)

堆定义

上面提到的利用具有特殊节点顺序的二叉树完成排序的方式,就是堆排序。这里所说的节点顺序是指:树中每个节点的值都不小于(不大于)它的子节点值。堆描述的是一颗完全二叉树,在对数组进行排序的过程中,并不是真的构建一个二叉树结构,只是将数组中元素下标映射到完全二叉树,利用元素下标来表示父节点和子节点关系。

list type
tree type

通过以上两张图可知,堆中父子节点的下标关系为:

  • 下标为 i 的节点,其左子节点下标为 2*i+1
  • 下标为 i 的节点,其右子节点下标为 2*i+2
  • 下标为 i 的节点,其父节点下标为 \lfloor {\frac {i-1} 2} \rfloor(i\ge1)

算法过程

以递增排序为例,集合初始为待排序集合,已排序集合为空

  1. 构造最大堆,即调整待排序集合,使得元素映射出的完全二叉树,满足每个节点元素值都不小于其子节点值
  2. 替换待排序集合中第一个元素和最后一个元素值,即在待排序集合映射出的完全二叉树上,将根节点值和树中最下面一层、最右边的节点值进行替换
  3. 调整堆结构使其满足节点大小顺序,标记待排序集合最后一个元素为已排序
  4. 重复步骤2, 3,直到待排序集合只有一个元素

演示示例

调整为最大堆结构

要保证每个节点的值不小于其左右子节点的值,只需要从后往前遍历集合中每个具有子节点的节点,使得其节点值不小于左右子节点的值即可(递归与子节点进行比较)。已知下标为 i 的节点,其父节点下标为 \lfloor {\frac {i-1} 2} \rfloor(i\ge1),所以具有 N 个元素的集合,起始遍历节点的下标为 \lfloor { {\frac {N} 2} -1} \rfloor(i\ge1)

起始待调整元素下标为 4,即值为 2 的节点

1 次调整后,下一个待调整元素下标为 3,即值为 0 的节点

2 次调整后,下一个待调整元素下标为 2,即值为 4 的节点

3 次调整后,下一个待调整元素下标为 1,即值为 3 的节点。这里注意,节点 3 与子节点 9 比较并交换后,需要递归与子节点进行比较,直到值不小于子节点值

step_1
step_2

4 次调整后,下一个待调整元素下标为 0,即值为 5 的节点。同样涉及递归操作

5 次调整后,当前结构即为最大堆

调整代码
def transformToHeap(arr, index, end):
    targetIndex, leftChildIndex, rightChildIndex = index, 2 * index + 1, 2 * index + 2
    if leftChildIndex < end and arr[leftChildIndex] > arr[targetIndex]:
        targetIndex = leftChildIndex
    if rightChildIndex < end and arr[rightChildIndex] > arr[targetIndex]:
        targetIndex = rightChildIndex
    if not targetIndex == index:
        arr[index], arr[targetIndex] = arr[targetIndex], arr[index]
        transformToHeap(arr, targetIndex, end)

代码中声明 targetIndex 用于指向根节点、左右子节点中的最大节点,若需要替换节点值,则递归调整替换后的根节点和其左右子节点。end 变量用于标志待排序集合的边界。

迭代获取堆顶元素

重复将待排序集合首元素和尾元素进行替换,标记替换后的尾元素为已排序,并调整堆结构使其重新成为最大堆。

起始待替换根节点为 9,第 1 次替换并调整后结构后(调整过程上面已列出)
待排序集合:[8, 7, 4, 6, 5, 1, 2, 3, 0]
已排序集合:[9]

下一个待替换根节点为 8,第 2 次替换并调整后结构后
待排序集合:[7, 6, 4, 3, 5, 1, 2, 0]
已排序集合:[8, 9]


...
...
...

下一个待替换根节点为 0,第 9 次替换并调整后结构后
待排序集合:[0]
已排序集合:[1, 2, 3, 4, 5, 6, 7, 8, 9]

观察以上过程可知,每次排序后待排序集合元素数减一。N 个元素的序列,经过 N-1 次排序后,待排序集合元素数为一,即完成排序。

迭代操作代码
def heapSort(arr):
    index = len(arr) // 2 - 1
    while index >= 0:
        transformToHeap(arr, index, len(arr))  # transform arr to heap arr
        index = index - 1
    num = 1
    while num < len(arr):
        arr[0], arr[-num] = arr[-num], arr[0]
        transformToHeap(arr, 0, len(arr) - num)  # transform arr to heap arr
        num = num + 1

代码中第一个循环为构造最大堆,第二个循环为替换待排序集合首尾元素,并调整最大堆。

算法分析

堆排序是一种不稳定排序算法,对于 N 个元素的序列,构造堆过程,需要遍历的元素次数为 O(N),每个元素的调整次数为 O(log_2N),所以构造堆复杂度为 O(Nlog_2N)。迭代替换待排序集合首尾元素的次数为 O(N),每次替换后调整次数为 O(log_2N),所以迭代操作的复杂度为 O(Nlog_2N)。由此可知堆排序的时间复杂度为 O(Nlog_2N),排序过程属于原地排序,不需要额外的存储空间,所以空间复杂度为 O(1)

github 链接:堆排序

相关文章
|
6月前
|
算法 Python
数据结构算法--4堆排序
堆排序过程概述:建立大根堆,将堆顶最大元素移出并替换为末尾元素,调整保持堆性质,重复此过程直至堆为空,实现排序。时间复杂度为O(nlogn)。Python中可用heapq模块进行堆操作。
|
7月前
|
机器学习/深度学习 人工智能 算法
数据结构与算法:堆排序和TOP-K问题
朋友们大家好,本节内容来到堆的应用:堆排序和topk问题
数据结构与算法:堆排序和TOP-K问题
|
7月前
|
存储 人工智能 算法
深入浅出堆排序: 高效算法背后的原理与性能
深入浅出堆排序: 高效算法背后的原理与性能
125 1
|
2月前
|
算法 搜索推荐
数据结构与算法学习十八:堆排序
这篇文章介绍了堆排序是一种通过构建堆数据结构来实现的高效排序算法,具有平均和最坏时间复杂度为O(nlogn)的特点。
78 0
数据结构与算法学习十八:堆排序
|
2月前
|
算法 搜索推荐
算法之堆排序
本文介绍了堆排序算法的原理和实现,通过构建最大堆或最小堆,利用堆的性质进行高效的排序,并提供了具体的编程实现细节和示例。
29 0
算法之堆排序
|
2月前
|
算法 Java Go
深入了解堆排序算法
深入了解堆排序算法
39 1
|
7月前
|
移动开发 算法 前端开发
前端算法之堆排序
前端算法之堆排序
42 1
|
6月前
|
搜索推荐 算法 Java
Java中的快速排序、归并排序和堆排序是常见的排序算法。
【6月更文挑战第21天】Java中的快速排序、归并排序和堆排序是常见的排序算法。快速排序采用分治,以基准元素划分数组并递归排序;归并排序同样分治,先分割再合并有序子数组;堆排序通过构建堆来排序,保持堆性质并交换堆顶元素。每种算法各有优劣:快排平均高效,最坏O(n²);归并稳定O(n log n)但需额外空间;堆排序O(n log n)且原地排序,但不稳定。
52 3
|
6月前
|
搜索推荐 算法
【C/排序算法】:堆排序和选择排序
【C/排序算法】:堆排序和选择排序
40 0
|
6月前
|
存储 算法 C语言
数据结构和算法——堆排序(选择排序、思路图解、代码、时间复杂度、堆排序及代码)
数据结构和算法——堆排序(选择排序、思路图解、代码、时间复杂度、堆排序及代码)
41 0