齐姐漫画:排序算法(一)

简介: 借用《算法导论》里的例子,就是我们打牌的时候,每新拿一张牌都会把它按顺序插入,这,其实就是插入排序。

对于数组来说怎么做呢?


有一个重要的思想,叫做挡板法,就是用挡板把数组分成两个区间:


  • 挡板左边:已排序


  • 挡板右边:未排序


那么排序分三步走


  1. 最初挡板是在数组的最左边,保证已排序区间里一个数都没有,或者也可以包含一个数啦;


  1. 核心思想就是:


依次遍历未排序区间里的元素,在已排序区间里找到正确的位置插入;


  1. 重复这个过程,直到未排序区间为空。


举个例子:{5, 2, 1, 0}


第一步,挡板最初在这里:


image.png


第二步,


把 2 插入已排序区间的正确位置,变成:


image.png


重复这个步骤,把 1 排好:


image.png


最后把 0 排好:


image.png


那代码也很简单:


public void insertionSort(int[] input) {
    if(input == null || input.length <= 1) {
        return;
    }
    for(int i = 1; i < input.length; i++) {
        int tmp = input[i];
        int j = i - 1;
        while(j >= 0 && input[j] > tmp) {
            input[j+1] = input[j];
            j --;
        }
        input[j+1] = tmp;
    }
}


我们来分析一下这个算法的时空复杂度。


时间复杂度


关于时间复杂度大 O 有两个要点


  • 是描述随着自变量的增长,所需时间的增长率;


  • 是渐近线复杂度,就是说


  • 不看系数
  • 只看最高阶项


那么我们关心的 worst case 的情况就是:


如果数组是近乎倒序的,每次插入都要在数组的第一个位置插入,那么已排序区间内的所有的元素都要往后移动一位,这一步平均是 O(n),那么重复 n 次就是 O(n^2).


空间复杂度


重点是一个峰值的概念,并不是累计使用的空间。


这里是 O(1) 没什么好说的。


引入一个概念:sorted in place,也就是原地排序


原地排序就是指空间复杂度为 O(1) 的算法,因为没有占用额外的空间,就是原地打转嘛。


其实 in-place 的思想并不是只在排序算法里有,只不过排序算法是一个最广为人知的例子罢了。本质上就是一个节省使用空间的思想。


但是对于排序算法,只分析它的时空复杂度是不够的,还有另外一个重要指标:


稳定性


意思是元素之间的相对顺序是否保持了不变。


比如说:{5, 2, 2, 1, 0}


这个数组排序完成后这里面的两个 2 的相对顺序没有变,那么这个排序就是一个稳定排序。


那有同学可能就想,顺序变了又有什么关系呢?


其实,在实际工作中我们排序的对象不会只是一个数字,而是一个个的对象 (object),那么先按照对象的一个性质来排序,再按照另一个性质来排序,那就不希望原来的那个顺序被改变了。好像有点抽象,我们举个例子。


比如在股票交易系统里,有买卖双方的报价,那是如何匹配的呢?


  • 先按照价格排序;


  • 在相等的价格中,按照出价的时间顺序来排序。


那么一般来说系统会维持一个按时间排序的价格序列,那么此时只需要用一个具有稳定性的排序算法,再按照价格大小来排序就好了。因为稳定性的排序算法可以保持大小相同的两个对象仍维持着原来的时间顺序。


那么插入排序是否是稳定性的排序呢?


答案是肯定的。因为在我们插入新元素的时候是从后往前检查,并不是像打牌的时候随便插一个位置不能保证相对顺序。


大家可以看下下面的动画 就非常清楚了~


image.png


优化


插入排序其实是有很大的优化空间的,你可以搜一下“希尔排序”。


在刚开始学习的时候,深度固然重要,但因为广度不够,如果学的太深可能会很痛苦,一个知识点就无穷无尽的延展,这并不是一个高效的学习方式。


时间有限时还要做好深度和广度的平衡:


  • 在常用常考的知识点上多花时间精力,追求深度;


  • 在一些拓展性的知识点上点到为止,先知道有这么回事就行。


保持 open minded 的心态,后期就会有质的提高。



image.png


image.png


选择排序


选择排序也是利用了“挡板法”这个经典思想。


挡板左边是已排序区间,右边是未排序区间,那么每次的“选择”是去找右边未排序区间的最小值,找到之后和挡板后面的第一个值换一下,然后再把挡板往右移动一位,保证排好序的这些元素在挡板的左边。


比如之前的例子:{5, 2, 0, 1}


我们用一个挡板来分隔数组是否排好序,


用指针 j 来寻找未排序区间的最小值;


image.png


第一轮 j 最初指向 5,然后遍历整个未排序区间,最终指向 0,那么 0 就和挡板后的第一个元素换一下,也就是和 5 交换一下位置,挡板向右移动一位,结束第一轮。


image.png


第二轮,j 从挡板后的2开始遍历,最终指向1,然后1和挡板后的第一个元素 2 换一下,挡板向右移动一位,结束第二轮。


image.png


第三轮,j 从2开始遍历,最终指向2,然后和2自己换一下,挡板向右移动一位,结束第三轮。


image.png


还剩一个元素,不用遍历了,就结束了。


选择排序与之前的插入排序对比来看,要注意两点:


  1. 挡板必须从 0 开始,而不能从 1 开始。虽然在这两种算法中,挡板的物理意义都是分隔已排序和未排序区间,但是它们的已排序区间里放的元素的意义不同:


  • 选择排序是只能把当前的最小值放进来,而不能放其他的;


  • 插入排序的第一个元素可以为任意值。


所以选择排序的挡板左边最开始不能有任何元素。


  1. 在外层循环时,


  • 选择排序的最后一轮可以省略,因为只剩下最大的那个元素了;


  • 插入排序的最后一轮不可省略,因为它的位置还没定呢。


class Solution {
  public void selectionSort(int[] input) {
    if(input == null || input.length <= 1) {
      return;
    } 
    for(int i = 0; i < input.length - 1; i++) {
      int minValueIndex = i;
      for(int j = i + 1; j < input.length; j++) {
        if(input[j] < input[minValueIndex]) {
          minValueIndex = j;
        }
      }
      swap(input, minValueIndex, i);
    }
  }
  private void swap(int[] input, int x, int y) {
    int tmp = input[x];
    input[x] = input[y];
    input[y] = tmp;
  }
}


image.png


时间复杂度


最内层的 if 语句每执行一次是 O(1) ,那么要执行多少次呢?


  • 当 i = 0 时,是 n-1 次;


  • 当 i = 1 时,是 n-2 次;


  • ...


  • 最后是 1 次;


所以加起来,总共是:


(n-1) + (n-2) + … + 1 = n*(n-1) / 2 = O(n^2)


是这样算出来的,而不是一拍脑袋说两层循环就是 O(n^2).


空间复杂度


这个很简单,最多的情况是 call swap() 的时候,然后 call stack 上每一层就用了几个有限的变量,所以是 O(1)。


那自然也是原地排序算法了。


稳定性


这个答案是否定的,选择排序并没有稳定性。


因为交换的过程破坏了原有的相对顺序,比如: {5, 5, 2, 1, 0} 这个例子,第一次交换是 0 和 第一个 5 交换,于是第一个 5 跑到了数组的最后一位,且再也无翻身之地,所以第一个 5 第二个 5 的相对顺序就已经打乱了。


这个问题在石头哥的那篇谷歌面经文章里有被考到哦,如果还没有看过这篇面经文章的,在「码农田小齐」公众号里回复「谷歌」二字,就可以看到了。


优化


选择排序的其中一步是选出每一轮的最小值,那么这一步如果使用 heapify() 来优化,就可以从 O(n) 优化到 O(logn),这其实就变成了 heapSort.


image.png


image.png


image.png



目录
相关文章
|
搜索推荐 算法 IDE
齐姐漫画:排序算法(二)之「 归并排序」和「外排序」
那我们借用 cs50 里的例子,比如要把一摞卷子排好序,那用并归排序的思想是怎么做的呢?
139 0
齐姐漫画:排序算法(二)之「 归并排序」和「外排序」
|
1月前
|
传感器 算法 计算机视觉
基于肤色模型和中值滤波的手部检测算法FPGA实现,包括tb测试文件和MATLAB辅助验证
该内容是关于一个基于肤色模型和中值滤波的手部检测算法的描述,包括算法的运行效果图和所使用的软件版本(matlab2022a, vivado2019.2)。算法分为肤色分割和中值滤波两步,其中肤色模型在YCbCr色彩空间定义,中值滤波用于去除噪声。提供了一段核心程序代码,用于处理图像数据并在FPGA上实现。最终,检测结果输出到&quot;hand.txt&quot;文件。
|
1月前
|
机器学习/深度学习 算法 计算机视觉
基于yolov2深度学习网络的视频手部检测算法matlab仿真
基于yolov2深度学习网络的视频手部检测算法matlab仿真
|
1月前
|
算法
【MATLAB】语音信号识别与处理:移动中位数滤波算法去噪及谱相减算法呈现频谱
【MATLAB】语音信号识别与处理:移动中位数滤波算法去噪及谱相减算法呈现频谱
23 2
|
1月前
|
算法
【MATLAB】语音信号识别与处理:一维信号NLM非局部均值滤波算法去噪及谱相减算法呈现频谱
【MATLAB】语音信号识别与处理:一维信号NLM非局部均值滤波算法去噪及谱相减算法呈现频谱
40 1
|
7天前
|
机器学习/深度学习 人工智能 算法
基于DCT和扩频的音频水印嵌入提取算法matlab仿真
本文介绍了结合DCT和扩频技术的音频水印算法,用于在不降低音质的情况下嵌入版权信息。在matlab2022a中实现,算法利用DCT进行频域处理,通过扩频增强水印的隐蔽性和抗攻击性。核心程序展示了水印的嵌入与提取过程,包括DCT变换、水印扩频及反变换步骤。该方法有效且专业,未来研究将侧重于提高实用性和安全性。
|
1天前
|
数据采集 算法 数据可视化
MATLAB、R用改进Fuzzy C-means模糊C均值聚类算法的微博用户特征调研数据聚类研究
MATLAB、R用改进Fuzzy C-means模糊C均值聚类算法的微博用户特征调研数据聚类研究
|
11天前
|
文字识别 算法 计算机视觉
图像倾斜校正算法的MATLAB实现:图像倾斜角检测及校正
图像倾斜校正算法的MATLAB实现:图像倾斜角检测及校正
15 0
|
14天前
|
机器学习/深度学习 算法
【MATLAB】GA_ELM神经网络时序预测算法
【MATLAB】GA_ELM神经网络时序预测算法
286 9