常见排序算法及其稳定性分析

简介: 常见排序算法及其稳定性分析

前言:

排序算法可以说是每一个程序员在学习数据结构和算法时必须要掌握的知识点,同样也是面试过程中可能会遇到的问题,在早些年甚至还会考冒泡排序。由此可见呢,掌握一些常见的排序算法是一个程序员的基本素养。虽然现在的语言标准库里都有直接的排序函数,但是作为一个学习者,我们应当抱着“知其然,还要知其所以然”的态度去学习。

1.常见的排序算法有哪些?

常见的排序算法及其性能:

算法名称 平均时间复杂度 稳定性
直接插入排序 N^2 稳定
希尔排序 N^1.25--1.6N^1.25 不稳定
选择排序 N^2 不稳定
堆排序 NlogN 不稳定
冒泡排序 N^2 稳定
快速排序 NlogN 不稳定
归并排序 NlogN 稳定

这里呢我只讲一些效率比较高的排序算法,比如快排、并排、堆排序、希尔排序。

2.常见排序算法的实现

2.1希尔排序

希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成grap个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序(插入排序)。然后,重复上述分组和排序的工作。当分组间距为1时,所有记录在统一组内排好序。

代码实现:

 
// 希尔排序
void ShellSort(int* a, int n) {
  int gap = n - 1;//grap为分组之间的间隔
  while (gap > 1) {
    gap = gap / 3 + 1;//每次分组的间距都越来越小,直到间距为一
    for (int i = 0; i < gap; i++) {//i表示每组的开头位置
      for (int j = i; j < n - gap; j += gap) {//对每一组插入排序
        int end = j;
        int temp = a[j + gap];
        while (end >= 0) {
          if (temp < a[end]) {
            a[end + gap] = a[end];
            end -= gap;
          }
          else {
            break;
          }
        }
        a[end + gap] = temp;
      }
    }
  }
}

希尔排序的特性总结:

1. 希尔排序是对直接插入排序的优化。

2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时(相当于对整个数组进行插入排序),数组已经接近有序的了,这样就 会很快。这样整体而言,可以达到优化的效果。

3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好多书中给出的 希尔排序的时间复杂度都不固定,目前也只能给出一个大概的复杂度。

2.2堆排序

关于堆排序在之前的博客中已经详细讲解过,有兴趣的可以去看看。

2.3快速排序

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中 的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右 子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

2.3.1递归版

对于单趟排序,我们确定一个基准值key,并利用双指针从首尾两端移动。找到一个位置放key,使得,key左边的元素都小于key(以升序排序为例),右边的元素都大于key

快排的算法思想本质是用空间换取时间,每一次递归排序的区间都在不断地缩小,每一趟排序都确定了下一趟排序的左右两个区间,类似于二叉树的节点的左右儿子节点

代码实现

int PartSort1(int* a, int left, int right) {//单趟排序
  int end = right;
  int begin = left;
  int mid = GetMid(a, left, right);//基准值的下标
  Swap(&a[left], &a[mid]);//跟首元素交换
  int key = left;
  while (begin < end) {
    while (end > begin && a[end] >= a[key])end--;
    while (end > begin && a[begin] <= a[key])begin++;
    Swap(&a[end], &a[begin]);
  }
  Swap(&a[key], &a[begin]);
  return begin;//单趟排序后返回最后key所处的位置
}
void QuickSort(int* a, int left, int right){//递归
     if (left >= right)return;
      int mid = PartSort3(a, left, right);
    QuickSort(a, left, mid - 1);
    QuickSort(a, mid + 1, right);
}

2.3.2非递归版

利用,我们可以将单趟排序确定的两个子区间存起来,模拟函数栈帧的开辟。这样一来,我们就可以不用递归(递归较为耗损空间)就可以完成快速排序。

代码实现

void QuickSortNonR(int* a, int left, int right) {
  Stack ST;
  StackInit(&ST);
  StackPush(&ST, right);//根据栈的特性,先将右区间压栈
  StackPush(&ST, left);
  while (!StackEmpty(&ST)) {
    int l = StackTop(&ST);
    StackPop(&ST);
    int r = StackTop(&ST);
    StackPop(&ST);//取出一个区间[l,r]
    if (l > r)Swap(&l, &r);
    int keyi = PartSort1(a, l, r);//单趟排序
    if (keyi -1> l) {
      StackPush(&ST, keyi - 1);
      StackPush(&ST, l);
    }
    if (keyi + 1 < r) {
      StackPush(&ST, r);
      StackPush(&ST, keyi + 1);
    }
  }
  StackDestroy(&ST);
}

2.4归并排序

2.4.1递归版

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 与快排不同的是,归并排序是先递归后排序。

实现思路:

因为要先满足每个子序列都有序的条件,我们可以把区间长度划分为1,这样每个区间都一定是有序的,再对每个区间先上合并。值得注意的是,有序地子区间合并之后也是有序的。同样是根据二叉树的思想,每个区间一分为两个子区间,直到区间长度为1,需要logN的时间复杂度,合并两个区间又是N的复杂度,所以总的时间复杂度为NlogN。

代码实现

void MergeSort(int* a, int begin, int end, int* temp) {//temp用于暂时存放合并后的数组
  if (begin >= end)return;
  int mid = (begin + end) / 2;
  MergeSort(a, begin, mid, temp);
  MergeSort(a, mid + 1, end, temp);//先递归区间
  
  int begin1 = begin, end1 = mid;
  int begin2 = mid + 1, end2 = end;//两个区间的端点指针
  int i = begin;//合并数组的下标的指针
  while (begin1 <= end1 && begin2 <= end2) {
    if (a[begin1] < a[begin2]) {//比较两个区间的首元素,小的放入temp中,两个指针往后移
      temp[i++] = a[begin1++];
    }
    else {
      temp[i++] = a[begin2++];
    }
  }//有可能还有某个区间还有元素没有放进去
  while (begin1 <= end1) {
    temp[i++] = a[begin1++];
  }
  while (begin2 <= end2) {
    temp[i++] = a[begin2++];
  }
  //将合并好的数组复制到原数组中
  memcpy(a + begin, temp + begin, sizeof(int) * (end - begin + 1));
}

2.4.2非递归版

既然快速排序有非递归版本,那么归并排序同样可以有非递归的版本。但是对于非递归的归并排序来说,并不能像快速排序一样使用栈这种结构来维护递归的区间。为什么呢?因为归并排序的前提是合并两个有序的区间。所以,用栈来处理就不能先有序再合并。我们可以用类似希尔排序的分组思想,根据递归归并排序的思想,从最底层开始,依次往上合并。

代码实现:

 
void MergeSortNonR(int* a, int n) {
  int* temp = malloc(sizeof(int) * n);
  if (temp == NULL) {
    perror("malloc");
  }
 
  int grap = 1;//每组元素个数,根据递归区间思想,上一层的组长度是下一层的一半
  
  while (grap < n) {//分组的元素个数小于n,等于n意味着就是整个数组
    for (int i = 0; i < n; i += grap * 2) {//每次合并相邻两个区间,i为第一个区间的起点
      int begin1 = i, end1 = i + grap - 1;
      int begin2 = i + grap, end2 = i + grap * 2 - 1;
 
      if (end1 >= n || begin2 >= n) {//查看当前的相邻的两个区间是否在数组中
        break;
      }
      if (end2 >= n) {//可能不够均分,最后一个区间右端点取n-1
        end2 = n - 1;
      }
      int cur = i;//以下就是合并区间
      while (begin1 <= end1 && begin2 <=end2) {
        if (a[begin1] < a[begin2]) {
          temp[cur++] = a[begin1++];
        }
        else {
          temp[cur++] = a[begin2++];
        }
      }
 
      while (begin1 <= end1) {
        temp[cur++] = a[begin1++];
      }
      while (begin2 <= end2) {
        temp[cur++] = a[begin2++];
      }
      memcpy(a + i, temp+i, sizeof(int)*(end2 -i + 1));
    }
    grap = grap * 2;//上一层的每一个区间元素个数
  }
  free(temp);
}

3.排序算法的稳定性

对于某种排序算法,如果会将两个相同大小的元素的相对位置改变,那么我们就称这个算法是不稳定的,否者就是稳定的。

什么时候需要考虑稳定性?

针对多个字段进行排序,就可能需要考虑排序算法的稳定性

举例:

对以下数据进行排序:

序号 订单金额 订单时间
1 50 9:04
2 30 9:00
3 50 9:03
4 10 9:01

要求:

是按照订单金额进行升序排序,如果订单金额相同,则按照下单时间升序排序

先按照订单时间升序排序得到序号为:2、4、3、1

再从上一个序号组中按照订单金额升序排

1.假如排序算法不稳定

则可能得到:4、2、1、3

对于序号1和3,订单金额相同,但是时间小的反而排在后面,不符合要求。

2.假如排序算法稳定

则一定得到:4、2、3、1

对于序号1和3,订单金额相同,下单时间大的排在后面,符合要求。

根据以上举例可以看出来,在对多个字段排序的时候,往往需要稳定的排序算法进行排序。

这也是为什么同样的时间复杂度,在有些时候能用不稳定的快排,有些时候用稳定归并排序。

相关文章
|
29天前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
53 4
|
12天前
|
并行计算 算法 IDE
【灵码助力Cuda算法分析】分析共享内存的矩阵乘法优化
本文介绍了如何利用通义灵码在Visual Studio 2022中对基于CUDA的共享内存矩阵乘法优化代码进行深入分析。文章从整体程序结构入手,逐步深入到线程调度、矩阵分块、循环展开等关键细节,最后通过带入具体值的方式进一步解析复杂循环逻辑,展示了通义灵码在辅助理解和优化CUDA编程中的强大功能。
|
19天前
|
算法
PID算法原理分析
【10月更文挑战第12天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
|
2月前
|
算法 搜索推荐 开发者
别再让复杂度拖你后腿!Python 算法设计与分析实战,教你如何精准评估与优化!
在 Python 编程中,算法的性能至关重要。本文将带您深入了解算法复杂度的概念,包括时间复杂度和空间复杂度。通过具体的例子,如冒泡排序算法 (`O(n^2)` 时间复杂度,`O(1)` 空间复杂度),我们将展示如何评估算法的性能。同时,我们还会介绍如何优化算法,例如使用 Python 的内置函数 `max` 来提高查找最大值的效率,或利用哈希表将查找时间从 `O(n)` 降至 `O(1)`。此外,还将介绍使用 `timeit` 模块等工具来评估算法性能的方法。通过不断实践,您将能更高效地优化 Python 程序。
51 4
|
25天前
|
算法
PID算法原理分析及优化
【10月更文挑战第6天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
|
2月前
|
算法 程序员 Python
程序员必看!Python复杂度分析全攻略,让你的算法设计既快又省内存!
在编程领域,Python以简洁的语法和强大的库支持成为众多程序员的首选语言。然而,性能优化仍是挑战。本文将带你深入了解Python算法的复杂度分析,从时间与空间复杂度入手,分享四大最佳实践:选择合适算法、优化实现、利用Python特性减少空间消耗及定期评估调整,助你写出高效且节省内存的代码,轻松应对各种编程挑战。
37 1
|
2月前
|
算法 数据可视化
基于SSA奇异谱分析算法的时间序列趋势线提取matlab仿真
奇异谱分析(SSA)是一种基于奇异值分解(SVD)和轨迹矩阵的非线性、非参数时间序列分析方法,适用于提取趋势、周期性和噪声成分。本项目使用MATLAB 2022a版本实现从强干扰序列中提取趋势线,并通过可视化展示了原时间序列与提取的趋势分量。代码实现了滑动窗口下的奇异值分解和分组重构,适用于非线性和非平稳时间序列分析。此方法在气候变化、金融市场和生物医学信号处理等领域有广泛应用。
111 19
|
1月前
|
算法 安全 Go
Python与Go语言中的哈希算法实现及对比分析
Python与Go语言中的哈希算法实现及对比分析
31 0
|
2月前
|
机器学习/深度学习 存储 人工智能
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
使用Python作为开发语言,基于文本数据集(一个积极的xls文本格式和一个消极的xls文本格式文件),使用Word2vec对文本进行处理。通过支持向量机SVM算法训练情绪分类模型。实现对文本消极情感和文本积极情感的识别。并基于Django框架开发网页平台实现对用户的可视化操作和数据存储。
45 0
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
|
2月前
|
编解码 算法 图形学
同一路RTSP|RTMP流如何同时回调YUV和RGB数据实现渲染和算法分析
我们播放RTSP|RTMP流,如果需要同时做渲染和算法分析的话,特别是渲染在上层实现(比如Unity),算法是python这种情况,拉两路流,更耗费带宽和性能,拉一路流,同时回调YUV和RGB数据也可以,但是更灵活的是本文提到的按需转算法期望的RGB数据,然后做算法处理