排序算法(七):快速排序-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

排序算法(七):快速排序

简介: 快速排序是通过分治的方式,根据选定元素将待排序集合拆分为两个值域的子集合,并对子集合递归拆分,当拆分后的每个子集合中元素个数为一时,自然就是有序状态。
img_8c748cdaabecbbf03c953d47174ef18e.jpe

快速排序是通过分治的方式,根据选定元素将待排序集合拆分为两个值域的子集合,并对子集合递归拆分,当拆分后的每个子集合中元素个数为一时,自然就是有序状态。

归并排序也是基于分治的思想,不过归并流程是将子集合合并成为有序的集合,递归执行来完成整个集合的排序。快速排序的分治流程是根据选定元素,将集合分隔为两个子集合,一个子集合中所有元素不大于选定元素值,另一个子集合中所有元素不小于选定元素值,则用于拆分集合的选定元素即为已排序元素。即每次拆分都会形成一个已排序元素,所以 N 个元素的序列,拆分的次数级别为 O(N)。将拆分过程类比为二叉树形式,考虑普通二叉树和斜树的情况,则二叉树高度级别为 O(log_2N)~O(N)

算法过程

  1. 在所有集合中均选定某一个元素;
  2. 根据选定元素,将每个集合拆分为元素值不大于该元素值的子集合,和元素值不小于该元素值的子集合;
  3. 重复步骤 1,2,直到每个集合中元素个数为 1。

演示示例

假设每个集合中的选定元素 Tr 为集合中的最后一个元素。

拆分过程

拆分过程也就是将集合中元素值不大于 Tr 的元素,和元素值不小于 Tr 的元素,通过交换元素位置的方式分别移动到 Tr 元素的两侧,这里不妨称之为正确区域。由此可知,在拆分过程中,若已将集合中所有小于 Tr 值的元素移动到正确区域中,则拆分过程完成。

如下示例中 B1B2 元素值不小于 TrS1S2S3 元素值小于 Tr

img_13621bf16e085dd97d5fb4bbf03cb86e.png

在集合由左向右的遍历过程中,若当前元素值小于 Tr 值时,则将当前元素替换到正确区域中。所以在拆分过程中需要维持两个变量 indexindex_{right},分别指向当前遍历的元素位置,和正确区域尾部的下一个元素位置,或者称之为带加入正确区域的元素位置。

首次访问: index = 0index_{right} = 0,皆指向 S1
此时正确区域为空,所以正确区域尾部的下一个元素位置也就是起始元素位置

img_dc69faaded17d54d90a059b55e40bcec.png

因为 S1 值小于 Tr,所以替换 indexindex_{right} 指向的元素值(其实不用替换,就是同一个元素),移动 indexindex_{right} 各自指向下一个元素位置。

第 2 次访问: index = 1index_{right} = 1,皆指向 B1
此时正确区域元素为:[S1],所以正确区域尾部的下一个元素就是 B1

img_dab7e3d7e8f9f5200dce95994014d3b0.png

B1 元素值不小于 Tr,所以 index 指向下一个元素,index_{right} 指向不变

第 3 次访问: index = 2,指向 B2index_{right} = 1,指向 B1
此时正确区域元素为:[S1],所以正确区域尾部的下一个元素就是 B1

img_8c5f855620a23edf1d697acf821e59f6.png

B2 元素值不小于 Tr,所以 index 指向下一个元素,index_{right} 指向不变

第 4 次访问: index = 3,指向 S2index_{right} = 1,指向 B1
此时正确区域元素为:[S1],所以正确区域尾部的下一个元素就是 B1

img_4238376253248f490c7a7de603c74891.png

S2 元素值小于 Tr,所以替换 indexindex_{right} 指向的元素值,移动 indexindex_{right} 各自指向下一个元素位置。

第 5 次访问: index = 4,指向 S3index_{right} = 2,指向 B2
此时正确区域元素为:[S1, S2],所以正确区域尾部的下一个元素就是 B2

img_1b29bb5485d373997acc77071399aa15.png

S3 元素值小于 Tr,所以替换 indexindex_{right} 指向的元素值,移动 indexindex_{right} 各自指向下一个元素位置。

第 6 次访问: index = 5,指向 Trindex_{right} = 3,指向 B1
此时正确区域元素为:[S1, S2, S3],所以正确区域尾部的下一个元素就是 B1

img_956686bd59240e727d3850554b70bd9e.png

因为访问到了集合尾部的选定元素,此时替换 indexindex_{right} 指向的元素值,完成拆分过程。

img_addf34ea3da9c4c1813d01482bd26f93.png

此时可以发现,选定元素的左右两侧皆为正确区域,即左侧元素值都不大于 Tr 值,右侧元素值都不小于 Tr 值。所以下一轮进行拆分的则为 [S1, S2, S3] 构成的集合和 [B2, B1] 构成的集合。

拆分过程存在一种现象,例如当前情况下是取集合的最后一个元素为选定元素进行拆分,若初始序列为有序状态,则每一次拆分后的两个集合,一个集合元素个数为 N-1,另一个集合为空,递归进行拆解时情况同样如此,也就是走势宛如斜树一般。

算法示例

def sort(arr, left, right):
    if left < right:
        divide = quickSort(arr, left, right)   # the divide operation
        sort(arr, left, divide - 1)   # recursive sorting
        sort(arr, divide + 1, right)

def quickSort(arr, left, right):
    lessIndex, partitionValue = left, arr[right]
    for i in range(left, right):  #Traversing
        if arr[i] < partitionValue:
            arr[i], arr[lessIndex] = arr[lessIndex], arr[i]
            lessIndex = lessIndex + 1
    arr[lessIndex], arr[right] = partitionValue, arr[lessIndex]
    return lessIndex

quickSort 操作中的循环用于遍历集合中元素,每一次遍历结束,可以形成两个正确区域,即不大于选定元素值的元素区域,和不小于选定元素值得元素区域。因为是直接根据位置进行替换,所以相比较于两两相邻元素比较替换效率要高许多,当然也导致了算法的不稳定性。

算法分析

快速排序是一种非稳定排序算法,形式上类似于归并排序,操作上刚好相反,一个是对集合先拆分后操作,一个是对集合先操作后拆分。对于 N 个元素的初始集合,因为在每个子集合的拆分过程中,都需要对集合进行遍历比较,所以若对 K 个元素的集合进行拆分,则比较次数级别为 O(K),平均交换次数为 \frac K2,即交换次数级别为 O(K)。因为拆分集合的过程存在普通二叉树和斜树的情况,所以树高为 log_2N~N,每一层的平均比较和交换复杂度为 O(N),所以累加可得快速排序的比较和交换复杂度为 Nlog_2N ~ N^2。排序过程属于原地排序,不需要额外的存储空间,所以空间复杂度为 O(log_2N)~O(N)

github 链接:快速排序

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章