【漫画算法】指挥官的排序战术:快速排序算法解密

简介: 【漫画算法】指挥官的排序战术:快速排序算法解密

❤️❤️❤️ 欢迎来到我的博客。希望您能在这里找到既有价值又有趣的内容,和我一起探索、学习和成长。欢迎评论区畅所欲言、享受知识的乐趣!

期待与您一起探索技术、持续学习、一步步打怪升级 欢迎订阅本专栏❤️❤️

背景设定

现在你是一名军官,负责一个小队的战斗准备。小队有6名士兵,每个人的战斗力不同。为了最大化战斗效率,你需要根据士兵们的战斗力将他们从小到大排序

排序过程

  • 角色引入:六名士兵名字标识为①-⑥分别站成一行,每人盾牌显示着他们的战斗力。数值分别是20, 15, 10, 30, 25, 5。队伍看起来很混乱,没有任何顺序。

这时候你需要让他们根据战斗力从小到大排序你会怎么做?

  • 决策时刻
  • 作为军官,你决定选取第一名士兵(战斗力20)作为基准(基准士兵)。你让他举起手来,所有人的目光都集中在他身上。

  • 你命令:“比20战斗力低的,到他左边!比20战斗力高的,到他右边!动作快!”
  • 行动实施
  • 士兵们开始移动。士兵们根据你的命令重新排列自己的位置。战斗力为15和10的士兵迅速站到了左边,而战斗力为30和25的士兵则跑到了右边。战斗力为5的士兵最后一个,也加入到了左边。

  • 最终,基准士兵走到中间,正确的位置上。
  • 递归排序
  • 你接着指挥左边的小队和右边的小队分别进行相同的排序操作。左边的小队(15, 10, 5)和右边的小队(30, 25)也需要找到各自的基准,然后再次排序。
  • 你对左边的小队说:“15,你是这次的基准!”然后重复之前的排序指令。
  • 右边的小队也同样,选取30作为基准。

结局

  • 通过一系列的命令和移动,最终所有士兵都按照战斗力从低到高成功排序。
  • 排序完成后,队伍看起来整齐划一,每个士兵都知道自己的位置。你作为军官,对完成的排序感到满意,小队的战斗准备现在看起来更有序,准备迎接即将到来的挑战。

以上过程你作为军官用的就是快速排序的算法,看着步骤少是因为你能直接知道每个人的战斗力,并且每个人也知道其他人的战斗力,所以大家很快能排序好,实际通过代码实现的话步骤会更多一些,需要有更多的对比,因为没有提前知道其他人战斗力的前提在。

算法介绍

快速排序是一种非常高效的排序算法,由托尼·霍尔在1960年发明。它是一种使用分治策略的递归排序算法,目的是将一个大列表分为两个小列表,小列表中的元素分别比另一列表的元素小,然后递归地排序这两个子列表。

快速排序的基本步骤包括:

  1. 选择基准值(Pivot Selection)
    快速排序首先从数组中选择一个元素作为基准值,选择方法有多种,可以是第一个元素、最后一个元素、中间元素,或者随机元素,下图使用第一个元素。
  2. 分区操作(Partitioning)
    通过重新排列数组,使得比基准值小的元素全部移动到基准值的左侧,而比基准值大的元素全部移动到基准值的右侧。这个操作结束时,基准值就处于数组的中间位置。这一过程称为分区(Partitioning)。
  3. 递归排序子数组(Recursively Sorting the Sub-arrays)
    递归地将左侧子数组和右侧子数组进行排序。递归的基准情形是子数组的大小为0或1,这时子数组已经达到完全排序。

代码示例

def quicksort(nums, left, right):
    """
    递归执行快速排序,不断分割列表。
    
    参数:
    nums : list[int] -- 待排序的列表
    left : int -- 当前分割区域的左边界索引
    right : int -- 当前分割区域的右边界索引
    """
    if left < right:
        pi = partition(nums, left, right)
        print(nums, left,pi)
        quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分
        quicksort(nums, pi + 1, right)  # 递归排序基准右侧的部分
def partition(nums, left, right):
    """
    对数组进行划分,返回基准值的最终位置。
    
    参数:
    nums : list[int] -- 待排序的列表
    left : int -- 当前分割区域的左边界索引
    right : int -- 当前分割区域的右边界索引
    
    返回:
    int -- 基准值的最终位置索引
    """
    
    pivot = nums[left]  # 选择最左边的元素作为基准
    i = left + 1        # 将i初始化为基准右边的第一个元素
    j = right           # 将j初始化为最右边的元素
    while True:
        while i <= j and nums[i] <= pivot:       # i从左向右移动,直到找到一个大于基准的值
            i += 1
        while i <= j and nums[j] > pivot:        # j从右向左移动,直到找到一个小于基准的值
            j -= 1
        if i <= j:
            nums[i], nums[j] = nums[j], nums[i]  # 交换找到的两个值
        else:
            break
    nums[left], nums[j] = nums[j], nums[left]    # 将基准值进行交换
    return j                                     # 返回基准值的位置
# 测试代码
arr = [20, 15, 10, 25, 30, 5]
quicksort(arr, 0, len(arr) - 1)
print("Sorted array:", arr)

算法图解

partition1 按基准值进行左右分区
# 排序前 初始值
20, 15, 10, 25, 30,  5
# 第一次分区后 比基准值20小的在左边,比20大的在右边
5, 15, 10, 20, 25, 30

详细的动态GIF图参考,每个步骤变化时间2s,建议详细查看对比

image.png

partition2 递归排序左侧分区 5,15,10
# right = 3,指向20
quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分
# 第一次递归左分区 5,15,10
5, 15, 10, 20, 25, 30 
# 执行后还是返回 因为交换自己保持不变
5, 15, 10, 20, 25, 30
  1. i=1, 指向15,i 已经比基准值大,这时候保持=1不变
  2. j=2, 指向10,j 向左寻找比基准值小的值,这时候往左一直j=0的时候,这时候i>j,跳出循环
  3. j = left = 0,这时候5自己交换自己,这个步骤依然会执行
  4. 返回 j=0

partition3 递归排序左侧分区 15,10
# pi = 0,指向5
quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分
# 继续调用 quicksort,这时候 left < -1,不成立,所以走到右侧部分
quicksort(nums, pi + 1, right)
# 5, 15, 10, 20, 25, 30 排序 15,10 后
5, 10 ,15, 20, 25, 30
  1. i=2, 指向10,向右移动,指向20
  2. j=2, 指向10,小于基准值15,保持不变
  3. i>j,交换j和基准值

4. 交换后返回j=2

partition4 递归排序右侧分区 25, 30

同上忽略

快速排序的算法性能

  • 时间复杂度
  • 最好情况:(O(n log n)),当分区操作能将列表均等划分时。
  • 平均情况:(O(n log n)),对于随机排列的数组。
  • 最坏情况:(O(n^2)),当数组已经接近排序完成或完全逆序时,每次分区只能减少一个元素。
  • 空间复杂度
  • 最坏情况下,由于递归调用的栈空间,空间复杂度为 (O(n))。
  • 通过尾递归优化,可以将空间复杂度降低到 (O(\log n))。

快速排序的优点与缺点

  • 优点
  • 平均情况下非常高效。
  • 排序是就地进行的,除了递归栈,不需要额外的存储空间。
  • 高度优化的快速排序通常比其他 (O(n \log n)) 算法更快。
  • 缺点
  • 最坏情况下的性能较差。
  • 递归导致的堆栈溢出。
  • 非稳定排序,即相等的元素的原始顺序可能会被打乱。

算法改进

基于快速排序存在的缺点,我们一起来探讨一下这些问题,并提供几种改进策略,包括代码示例。

快速排序的基本问题

  1. 最坏情况性能:当输入数组已经接近排序完成或完全逆序时,快速排序的性能退化到 (O(n^2))。这种情况发生在基准值选取不当时,如始终选择第一个元素作为基准值。
  2. 重复元素处理:当数组中存在大量重复元素时,快速排序可能会进行不必要的比较和交换,导致效率降低。

改进策略

1. 优化基准值选择

一个好的基准值选择可以最大限度地确保数组被均等地分割,从而优化递归的深度和效率。

  • 三数取中法
    从数组的第一个元素、中间元素和最后一个元素中选择中位数作为基准值。这种方法通常可以防止对已经部分排序的数组进行排序时的性能退化。
2. 尾递归优化

快速排序通常通过递归实现,递归调用会消耗额外的栈空间。优化递归调用可以减少栈空间的使用。

  • 尾递归
    总是先递归较小的子数组,然后使用尾递归(或循环)处理较大的子数组。这可以确保递归栈的最大深度尽可能小。
3. 小数组切换到插入排序

插入排序在小数组上表现更优,因为它的常数因子较小,简单且快速。

  • 混合排序策略
    当数组大小减少到某个阈值(通常是10-20)时,切换到插入排序。
4. 处理重复元素

大量重复元素会减慢快速排序的速度,因为它们增加了不必要的比较和交换。

  • 三向切分快速排序
    这种变体通过将数组切分为三部分来处理含有大量重复元素的数组:小于基准值的元素、等于基准值的元素、以及大于基准值的元素。

代码示例:改进的快速排序

以下是一个集成了这些改进策略的快速排序的Python实现:

import random
def quicksort(arr, low, high):
    while low < high:
        if high - low < 16:  # 小数组使用插入排序
            insertion_sort(arr, low, high)
            break
        else:
            pivot_index = partition(arr, low, high)
            if pivot_index - low < high - pivot_index:
                quicksort(arr, low, pivot_index - 1)
                low = pivot_index + 1
            else:
                quicksort(arr, pivot_index + 1, high)
                high = pivot_index - 1
def partition(arr, low, high):
    mid = (low + high) // 2
    pivot = sorted([arr[low], arr[mid], arr[high]])[1]
    pivot_index = arr.index(pivot)
    arr[pivot_index], arr[high] = arr[high], arr[pivot_index]
    i = low
    for j in range(low, high):
        if arr[j] <= pivot:
            arr[i], arr[j] = arr[j], arr[i]
            i += 1
    arr[i], arr[high] = arr[high], arr[i]
    return i
def insertion_sort(arr, low, high):
    for i in range(low + 1, high + 1):
        key = arr[i]
        j = i - 1
        while j >= low and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
array = [random.randint(0, 100) for _ in range(100)]
quicksort(array, 0, len(array) - 1)
print(array)

这段代码首先处理小数组的优化,并且使用三数取中法来选择基准值,以提高快速排序处理含有重复元素和部分排序数组的效率。此外,通过尾递归优化来减少栈深度。

快速排序的应用场景

快速排序适用于大数据集合,尤其是在平均性能很关键的场合。由于其就地排序的特性,也适合用于内存空间有限的系统。然而,对于小数组,其他 (O(n^2)) 的算法如插入排序可能更优,因此在实际应用中,快速排序常与其他排序算法结合使用。例如,在快速排序接近完成时切换到插入排序。

快速排序由于其优异的平均性能,广泛用于各种编程库和系统中,是处理大数据集的首选算法之一。

🌹🌹如果觉得这篇文对你有帮助的话,记得一键三连关注、赞👍🏻、收藏是对作者最大的鼓励,非常感谢 ❥(^_-)

❤️❤️作者知识有限,如有错误,请各位大佬评论区批评指正,不胜感激❥(^_-)


欢迎关注微信公众号 数据分析螺丝钉

相关文章
|
1月前
|
搜索推荐 C语言
【排序算法】快速排序升级版--三路快排详解 + 实现(c语言)
本文介绍了快速排序的升级版——三路快排。传统快速排序在处理大量相同元素时效率较低,而三路快排通过将数组分为三部分(小于、等于、大于基准值)来优化这一问题。文章详细讲解了三路快排的实现步骤,并提供了完整的代码示例。
57 4
|
26天前
|
存储 搜索推荐 Python
用 Python 实现快速排序算法。
快速排序的平均时间复杂度为$O(nlogn)$,空间复杂度为$O(logn)$。它在大多数情况下表现良好,但在某些特殊情况下可能会退化为最坏情况,时间复杂度为$O(n^2)$。你可以根据实际需求对代码进行调整和修改,或者尝试使用其他优化策略来提高快速排序的性能
117 61
|
1月前
|
搜索推荐 算法 C语言
【排序算法】八大排序(上)(c语言实现)(附源码)
本文介绍了四种常见的排序算法:冒泡排序、选择排序、插入排序和希尔排序。通过具体的代码实现和测试数据,详细解释了每种算法的工作原理和性能特点。冒泡排序通过不断交换相邻元素来排序,选择排序通过选择最小元素进行交换,插入排序通过逐步插入元素到已排序部分,而希尔排序则是插入排序的改进版,通过预排序使数据更接近有序,从而提高效率。文章最后总结了这四种算法的空间和时间复杂度,以及它们的稳定性。
103 8
|
1月前
|
搜索推荐 算法 C语言
【排序算法】八大排序(下)(c语言实现)(附源码)
本文继续学习并实现了八大排序算法中的后四种:堆排序、快速排序、归并排序和计数排序。详细介绍了每种排序算法的原理、步骤和代码实现,并通过测试数据展示了它们的性能表现。堆排序利用堆的特性进行排序,快速排序通过递归和多种划分方法实现高效排序,归并排序通过分治法将问题分解后再合并,计数排序则通过统计每个元素的出现次数实现非比较排序。最后,文章还对比了这些排序算法在处理一百万个整形数据时的运行时间,帮助读者了解不同算法的优劣。
116 7
|
2月前
|
搜索推荐 Shell
解析排序算法:十大排序方法的工作原理与性能比较
解析排序算法:十大排序方法的工作原理与性能比较
79 9
|
2月前
|
算法 搜索推荐 Shell
数据结构与算法学习十二:希尔排序、快速排序(递归、好理解)、归并排序(递归、难理解)
这篇文章介绍了希尔排序、快速排序和归并排序三种排序算法的基本概念、实现思路、代码实现及其测试结果。
37 1
|
2月前
|
算法 搜索推荐 Java
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
基数排序是一种稳定的排序算法,通过将数字按位数切割并分配到不同的桶中,以空间换时间的方式实现快速排序,但占用内存较大,不适合含有负数的数组。
41 0
数据结构与算法学习十三:基数排序,以空间换时间的稳定式排序,速度很快。
|
2月前
|
搜索推荐 Java Go
深入了解快速排序算法
深入了解快速排序算法
53 2
|
2月前
|
算法
❤️算法笔记❤️-(每日一刷-83、删除排序链表中的重复项)
❤️算法笔记❤️-(每日一刷-83、删除排序链表中的重复项)
34 0
|
2月前
|
存储 搜索推荐 算法
【排序算法(二)】——冒泡排序、快速排序和归并排序—>深层解析
【排序算法(二)】——冒泡排序、快速排序和归并排序—>深层解析