深入浅出八种排序算法

简介: 归并排序和快速排序是两种稍微复杂的排序算法,它们用的都是分治的思想,代码都通过递归来实现,过程非常相似。理解归并排序的重点是理解递推公式和 merge() 合并函数。

一,冒泡排序(Bubble Sort)

排序算法是程序员必须了解和熟悉的一类算法,排序算法有很多种,基础的如:冒泡、插入、选择、快速、归并、计数、基数和桶排序等。

冒泡排序只会操作相邻的两个数据。每次冒泡操作都会对相邻的两个元素进行比较,看是否满足大小关系要求,如果不满足就让它俩互换。一次冒泡会让至少一个元素移动到它应该在的位置,重复 n 次,就完成了 n 个数据的排序工作。

总结:如果数组有 n 个元素,最坏情况下,需要进行 n 次冒泡操作。

基础的冒泡排序算法的 C++ 代码如下:

// 将数据从小到大排序
void bubbleSort(int array[], int n){
    if (n<=1) return;
    for(int i=0; i<n; i++){
        for(int j=0; j<n-i; j++){
            if (temp > a[j+1]){
                temp = array[j]
                a[j] = a[j+1];
                a[j+1] = temp;
            }
        }
    }
}

实际上,以上的冒泡排序算法还可以优化,当某次冒泡操作已经不再进行数据交换时,说明数组已经达到有序,就不需要再继续执行后续的冒泡操作了。优化后的代码如下:

// 将数据从小到大排序
void bubbleSort(int array[], int n){
    if (n<=1) return;
    for(int i=0; i<n; i++){
        // 提前退出冒泡循环发标志位
        bool flag = False;
        for(int j=0; j<n-i; j++){
            if (temp > a[j+1]){
                temp = array[j]
                a[j] = a[j+1];
                a[j+1] = temp;
                flag = True; // 表示本次冒泡操作存在数据交换
            }
        }
        if(!flag) break;  // 没有数据交换,提交退出
    }
}

冒泡排序的特点

  1. 冒泡过程只涉及相邻元素的交换,只需要常量级的临时空间,故空间复杂度为 $O(1)$,是原地排序算法
  2. 当有相邻的两个元素大小相等的时候,我们不做交换,相同大小的数据在排序前后不会改变顺序,所以是稳定排序算法
  3. 最坏情况和平均时间复杂度都为 $O(n^2)$,最好时间复杂度是 $O(n)$。

二,插入排序(Insertion Sort)

  1. 插入排序算法将数组中的数据分为两个区间:已排序区间和未排序区间。最初始的已排序区间只有一个元素,就是数组的第一个元素。
  2. 插入排序算法的核心思想就是取未排序区间的一个元素,在已排序区间中找到一个合适的位置插入,并保证已排序区间数据一直有序。
  3. 重复这个过程,直到未排序区间元素为空,则算法结束。

插入排序和冒泡排序一样,也包含两种操作,一种是元素的比较,一种是元素的移动
当我们需要将一个数据 a 插入到已排序区间时,需要拿 a 与已排序区间的元素依次比较大小,找到合适的插入位置。找到插入点之后,我们还需要将插入点之后的元素顺序往后移动一位,这样才能腾出位置给元素 a 插入。

插入排序的 C++ 代码实现如下:

void InsertSort(int a[], int n){
    if (n <= 1) return;
    for (int i = 1; i < n; i++)  // 未排序区间范围
    {
        
        key  = a[i];    // 待排序第一个元素
        int j = i - 1;  // 已排序区间末尾元素
        // 从尾到头查找插入点方法
        while(key < a[j] && j >= 0){  // 元素比较
            a[j+1] = a[j];  // 数据向后移动一位
            j--;
        }
        a[j+1] = key;   // 插入数据
    }
}

插入排序的特点:

  1. 插入排序并不需要额外存储空间,空间复杂度是 $O(1)$,所以插入排序也是一个原地排序算法。
  2. 在插入排序中,对于值相同的元素,我们可以选择将后面出现的元素,插入到前面出现元素的后面,这样就可以保持原有的前后顺序不变,所以插入排序是稳定的排序算法。
  3. 最坏情况和平均时间复杂度都为 $O(n^2)$,最好时间复杂度是 $O(n)$。

三,选择排序(Selection Sort)

选择排序算法的实现思路有点类似插入排序,也分已排序区间和未排序区间。但是选择排序每次会从未排序区间中找到最小的元素,将其放到已排序区间的末尾。

选择排序的最好情况时间复杂度、最坏情况和平均情况时间复杂度都为 $O(n^2)$,是原地排序算法,且是不稳定的排序算法

选择排序的 C++ 代码实现如下:

void SelectSort(int a[], int n){
    for(int i=0; i<n; i++){
        int minIndex = i;
        for(int j = i;j<n;j++){
            if (a[j] < a[minIndex]) minIndex = j;
        }
        if (minIndex != i){
            temp = a[i]; 
            a[i] = a[minIndex];
            a[minIndex] = temp;
        }
    }
}

冒泡插入选择排序总结

冒泡插入选择排序总结

这三种排序算法,实现代码都非常简单,对于小规模数据的排序,用起来非常高效。但是在大规模数据排序的时候,这个时间复杂度还是稍微有点高,所以更倾向于用时间复杂度为 $O(nlogn)$ 的排序算法。

特定算法是依赖特定的数据结构的。以上三种排序算法,都是基于数组实现的。

四,归并排序(Merge Sort)

归并排序的核心思想比较简单。如果要排序一个数组,我们先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。

归并排序使用的是分治思想。分治,顾名思义,就是分而治之,将一个大问题分解成小的子问题来解决。小的子问题解决了,大问题也就解决了。

分治思想和递归思想有些类似,分治算法一般用递归实现。分治是一种解决问题的处理思想,递归是一种编程技巧,这两者并不冲突。

知道了归并排序用的是分治思想,而分治思想一般用递归实现,接下来的重点就是如何用递归实现归并排序。写递归代码的技巧就是,分析问题得出递推公式,然后找到终止条件,最后将递推公式翻译成递归代码。所以,要想写出归并排序的代码,得先写出归并排序的递推公式


递推公式:
merge_sort(p…r) = merge(merge_sort(p…q), merge_sort(q+1…r))

终止条件:
p >= r 不用再继续分解,即区间数组元素为 1 

归并排序的伪代码如下:

merge_sort(A, n){
    merge_sort_c(A, 0, n-1)
}
merge_sort_c(A, p, r){
    // 递归终止条件
    if (p>=r) then return
    // 取 p、r 中间的位置为 q
    q = (p+r)/2
    // 分治递归
    merge_sort_c(A[p, q], p, q)
    merge_sort_c(A[q+1, r], q+1, r)
    // 将A[p...q]和A[q+1...r]合并为A[p...r]  
    merge(A[p...r], A[p...q], A[q+1...r])
}

4.1,归并排序性能分析

1,归并排序是一个稳定的排序算法。分析:伪代码中 merge_sort_c() 函数只是分解问题并没有涉及移动元素和比较大小,真正的元素比较和数据移动在 merge() 函数部分。在合并过程中保证值相同的元素合并前后的顺序不变,归并排序排序就是一个稳定的排序算法。

2,归并排序的执行效率与要排序的原始数组的有序程度无关,所以其时间复杂度是非常稳定的,不管是最好情况、最坏情况,还是平均情况,时间复杂度都是 $O(nlogn)$。分析:不仅递归求解的问题可以写成递推公式,递归代码的时间复杂度也可以写成递推公式:

$$ T(n) = 2*T(n/2) + n; \;n>1 $$

$$ \begin{aligned} T(n) &= 2*T(n/2) + n \\ &= 2*(2*T(n/4) + n/2) + n = 4*T(n/4) + 2*n \\ &= 4*(2*T(n/8) + n/4) + 2*n = 8*T(n/8) + 3*n \\ &= 8*(2*T(n/16) + n/8) + 3*n = 16*T(n/16) + 4*n \\ &...... \\ &= 2^k * T(n/2^k) + k * n \\ &...... \end{aligned} $$

一步步分解推导可得 $T(n)= 2^k *T(n/2^k) + k* n$ 。当 $T(n/2^k)=T(1)$ 时,也就是 $n/2^k=1$,我们得到 $k=log2n$ 。我们将 $k$ 值代入上面的公式,得到 $T(n)=Cn+nlog2n$ 。如果我们用大 O 标记法来表示的话,$T(n)$ 就等于 $O(nlogn)$。所以归并排序的时间复杂度是 $O(nlogn)$。

3,空间复杂度是 O(n)。分析:递归代码的空间复杂度并不能像时间复杂度那样累加。尽管算法的每次合并操作都需要申请额外的内存空间,但在合并完成之后,临时开辟的内存空间就被释放掉了。在任意时刻,CPU 只会有一个函数在执行,也就只会有一个临时的内存空间在使用。临时内存空间最大也不会超过 n 个数据的大小,所以空间复杂度是 $O(n)$。

五,快速排序(Quicksort)

快排的思想是这样的:如果要排序数组中下标从 pr 之间的一组数据,我们选择 pr 之间的任意一个数据作为 pivot分区点)。我们遍历 p 到 r 之间的数据,将小于 pivot 的放到左边,将大于 pivot 的放到右边,将 pivot 放到中间。经过这一步骤之后,数组 p 到 r 之间的数据就被分成了三个部分,前面 pq-1 之间都是小于 pivot 的,中间是 pivot,后面的 q+1r 之间是大于 pivot 的。

根据分治、递归的处理思想,我们可以用递归排序下标从 pq-1 之间的数据和下标从 q+1r 之间的数据,直到区间缩小为 1,就说明所有的数据都有序了。

递推公式如下:

递推公式:
quick_sort(p,r) = quick_sort(p, q-1) + quick_sort(q, r)
终止条件:
p >= r

归并排序和快速排序总结

归并排序和快速排序是两种稍微复杂的排序算法,它们用的都是分治的思想,代码都通过递归来实现,过程非常相似。理解归并排序的重点是理解递推公式和 merge() 合并函数。同理,理解快排的重点也是理解递推公式,还有 partition() 分区函数。

除了以上 5 种排序算法,还有 3 种时间复杂度是 $O(n)$ 的线性排序算法:桶排序、计数排序、基数排序。这八种排序算法性能总结如下图:

排序算法总结

参考资料

版权声明©

  • 本文作者:嵌入式视觉
  • 版权声明:本文为「嵌入式视觉」的原创文章,首发于 github ,遵循 CC BY-NC-ND 4.0 版权协议,著作权归作者所有,转载请注明出处!
  • 鼓励博主:如果看完文章有所收获,一定要先点赞后收藏。毕竟,赠人玫瑰,手有余香!
相关文章
|
前端开发 JavaScript
JavaScript中的原型和原型链
JavaScript中的原型和原型链
926 0
|
3月前
|
人工智能 监控 搜索推荐
阿里云万小智 AI 建站使用教程,零代码 10 分钟上线企业官网
阿里云万小智AI建站教程:零代码10分钟上线企业官网!分四步——准备(域名+备案)、设计(选模板+拖拽控件)、发布(绑定域名+HTTPS)、推广(SEO+流量分析)。全程可视化操作,新手也能快速上手。
|
2月前
|
数据采集 人工智能 安全
OpenClaw 汉化版一键安装|Windows 保姆级教程,不用代码不用命令(包含新安装包)
从下载到运行一步到位,OpenClaw 中文整合安装包全自动配置,全程鼠标操作,不用敲指令、不用配环境,新手也能一次成功。
|
7月前
|
监控 安全 数据挖掘
《从被动修复到免疫:游戏Bug闭环体系的深度搭建指南》
本文聚焦游戏Bug自愈体系的搭建逻辑与实践路径,突破传统“发现-修复”的线性模式,提出以“系统自愈”为核心的闭环架构。文章从多维度感知网络构建、多指标分级权重模型、全链路修复管控、根因追溯复盘、动态迭代适配五大核心环节展开,结合开发实践中的场景化案例,阐述如何通过模块交叉场景库、反馈提炼机制、多层验证体系等实用方法,将Bug转化为系统韧性的养分。
389 6
|
7月前
|
人工智能 自然语言处理 搜索推荐
想让豆包在答案里提到你的官网?这三个步骤缺一不可
想让豆包引用你的官网?必须做好三步:一是将内容模块化、结构清晰,便于AI理解;二是通过专业资质、数据出处和结构化标记提升权威性;三是持续监测引用效果,优化内容策略。AI搜索时代,被“看见”才能赢得客户。
1317 1
|
6月前
|
存储 算法 BI
xxljob本地运行
本文介绍XXL-JOB分布式任务调度框架的部署与使用,涵盖源码获取、服务端数据库初始化、配置启动、客户端注册及定时任务测试全过程,助您快速搭建并运行调度系统。
|
8月前
|
存储 机器学习/深度学习 数据采集
101_参数高效微调_QLoRA技术深度解析与实践
在大型语言模型(LLM)时代,高效微调成为降低大模型应用门槛的关键技术。随着模型规模的不断扩大,传统的全参数微调方法面临着巨大的计算资源消耗和内存需求挑战。QLoRA(Quantized Low-Rank Adaptation)作为一种创新的参数高效微调技术,以其独特的量化+低秩适应双重策略,成功地在大幅降低资源消耗的同时保持了接近全精度微调的性能。本文将深入剖析QLoRA的技术原理、实现细节、性能特点,并提供丰富的实践案例,帮助读者全面掌握这一2025年仍然广泛应用的高效微调方法。
1154 1
|
XML Java 数据库连接
Spring Boot集成MyBatis
主要系统的讲解了 Spring Boot 集成 MyBatis 的过程,分为基于 xml 形式和基于注解的形式来讲解,通过实际配置手把手讲解了 Spring Boot 中 MyBatis 的使用方式,并针对注解方式,讲解了常见的问题已经解决方式,有很强的实战意义。在实际项目中,建议根据实际情况来确定使用哪种方式,一般 xml 和注解都在用。
|
SQL 关系型数据库 MySQL
阿里面试:1000万级大表, 如何 加索引?
45岁老架构师尼恩在其读者交流群中分享了如何在生产环境中给大表加索引的方法。文章详细介绍了两种索引构建方式:在线模式(Online DDL)和离线模式(Offline DDL),并深入探讨了 MySQL 5.6.7 之前的“影子策略”和 pt-online-schema-change 方案,以及 MySQL 5.6.7 之后的内部 Online DDL 特性。通过这些方法,可以有效地减少 DDL 操作对业务的影响,确保数据的一致性和完整性。尼恩还提供了大量面试题和解决方案,帮助读者在面试中充分展示技术实力。
出栈序列个数问题——用一个公式去解
出栈序列个数问题——用一个公式去解
721 0
出栈序列个数问题——用一个公式去解