数据结构各内部排序算法总结对比及动图演示(插入排序、冒泡和快速排序、选择排序、堆排序、归并排序和基数排序等)2

简介: 数据结构各内部排序算法总结对比及动图演示(插入排序、冒泡和快速排序、选择排序、堆排序、归并排序和基数排序等)2

三、选择排序

每一趟在后面n-i-1个元素中选取最小的元素,作为有序序列的第i个元素,直到第n-1趟排序完成。最重要的还是堆排序。

1.简单选择排序

①算法执行过程可视化演示:


②算法代码:

void SelectSort(ElemType A[], int n){
  for(int i = 0; i < n-1; i++){   //一共进行n-1趟 
    int min = i;          //记录最小元素的位置 
    for(j = i+1; j < n; j++)    //在待排序表中找到最小的元素 
      if(A[j] < A[min]) min = j;  //更新最小元素下标 
    if(min != i) swap(A[i], A[min]);//交换位置 
  }
}

③性能分析:

  1. 空间效率:使用常数个辅助单元,复杂度为O(1)。
  2. 时间效率:元素比较次数与初始状态无关,为n(n-1)/2次,移动次数最多为3(n-1)最少为0次,时间复杂度为O(n2)
  3. 稳定性:不稳定

2.堆排序

堆的定义: 满足n个关键字序列L[1...n]称为堆,堆可分为大根堆和小根堆,其在逻辑结构上可视为一棵完全二叉树

如果满足每个结点的值都大于其左孩子和右孩子结点的值,则是大根堆

如果满足每个结点的值都小于其左孩子和右孩子结点的值,则是小根堆
①算法的执行过程:

  • 首先将存放在表中的元素建成初始堆
  • 输出堆顶元素,末尾元素补位
  • 调整堆使其保持特性
  • 重复以上步骤至所有元素都已输出

堆排序核心问题:①如何建堆;②输出元素后如何调整。
②算法执行过程可视化演示:

1.大根堆建堆
从最后一个分支结点开始,与其孩子结点的值比较。如果不符合特性,则交换;如果是大根堆,选择孩子结点中的较大值,否则选择最小值;
交换之后如果孩子结点也是分支结点,继续向下比较;

反复利用上述过程构造下一级的堆,直至根结点。


2.输出

输出堆顶元素后,将最后一个元素与之交换;

此时堆的结构特性被破坏,需要向下筛选;

从上向下逐级比较,使每一级都符合特性。


除了以上的主要功能,堆还具有以下的作用:

  1. 插入



2.更新


③算法代码:

//大根堆的建立
void BuildMaxHeap(ElemType A[], int len){
  //从最后一个分支结点开始,逐级向上建堆 
  for(int i = len/2; i > 0; i--)
    HeapAdjust(A, i, len);
} 
void HeapAdjust(ElemType A[], int k, int len){
  A[0] = A[k];              //暂存这个分支结点 
  for(int i = 2*k; i <= len; i *= 2){   //从这个分支结点开始向下调整 
    if(i < len && A[i] < A[i+1]) i++; //右孩子更大 
    if(A[0] >= A[i]) break;       //分支结点已是子堆中的最大值,符合特性 
    else{               //不符合特性,需要调整 
      A[k] = A[i];          //换的时候只是覆盖
      k = i;              //下标要交换,下次还说与A[0]比较 
    }
  }
  A[k] = A[0];              //放到最终符合特性的位置上 
}
//堆排序
void HeapSort(ElemType A[], int len){
  BuildMaxHeap(A, len);     //建堆 
  for(int i = len; i > 1; i--){ //n-1趟交换和建堆过程 
    swap(A[i], A[1]);     //堆顶元素和堆底元素互换 
    HeapAdjust(A, 1, i-1);    //将剩余的元素调整 
  }
}

④性能分析:

  1. 空间效率:使用常数个辅助单元,空间复杂度为O(1)
  2. 时间效率:建堆时间为O(n),之后有n-1次向下调整,调整操作的时间复杂度为O(h)也就是O(log2n),所以堆排序的时间复杂度为O(nlog2n)。
  3. 稳定性:不稳定
  4. 适用性:适用于线性表为顺序存储的情况。

四、归并排序

归并排序与之前的算法思想不一样,它是将两个或以上的有序子表组合成一个新的有序表的过程。

我们称之为分治思想,在之前的快速排序中也有所体现。

①算法的执行过程:

对于n个元素的k路归并

首先可以开辟一块与表长度相同的辅助数组
分解: 将n个元素的待排序表分成各含n/2个元素的子表,每个表为长度为h的有序段。将每个子表进行递归的划分;

合并:每次归并时,将前后相邻且长度为h的有序段进行两两归并,得到前后相邻,长度为2h的有序段

经过logkn次排序之后整个表变为有序表

②算法执行过程可视化演示:


③算法代码:

ElemType *B = (ElemType*)malloc((n+1)*sizeof(ElemType));      //辅助数组B 
void Merge(ElemType A[], int low, int mid, int high){
  //
  for(int k = low; k <= high; k++) B[k] = A[k];         //将A的所有元素复制到B 
  for(int i = low, j = mid+1, k = i; i <= mid && j <= high; k++){ //将两个子表归并成一个有序表 
    if(B[i] <= B[j]) A[k] = B[i++];               //小元素放到前面,指针后移 
    else A[k] = B[j++];
  }
  while(i <= mid) A[k++] = B[i++];                //将A中剩余的元素复制到B 
  while(i <= high) A[k++] = B[j++];
}
void MergeSort(ElemType A[], int low, int high){          
  if(low < high){
    int mid = (low+high)/2;   //从中间划分两个子序列 
    MergeSort(A, low, mid);   //对左子表进行递归的排序 
    MergeSort(A, mid+1, high);  //对右子表进行递归的排序
    Merge(A, low, mid, high); //最后将两个序列归并到一起 
  }
}

④性能分析:

对于2路归并排序算法的性能分析如下:

  1. 空间效率:使用n个辅助单元,空间复杂度为O(n)
  2. 时间效率每趟递归的时间复杂度为O(n),一共需要log2n次归并,所以总的时间复杂度为O(nlog2n)
  3. 稳定性:稳定
  4. 适用性:适用于线性表为顺序存储的情况。

五、基数排序

基数排序是一种很特别的排序,它不基于比较和移动,而是基于各个位上关键字的大小进行排序。
假设长度为n的线性表由d元组(kjd-1, kjd-2, …, kj1, kj0)组成,其中kjd-1为最主位关键字,kj0为最次位关键字。

关键字排序有两种方法:

①最高位优先法:按关键字权重递减依次逐层划分成子序列,然后依次连接成有序序列。

②最低位优先法:按关键字权重递增依次逐层划分成子序列,然后依次连接成有序序列。

①算法的执行过程:

确定执行的轮数:确定数组中的最大元素有几位

创建编号为0-9的9个队列,因为所有的数字元素都是由0~9的十个数字组成
依次判断每个元素的个位,十位直至d位,根据相应数字存入对应的队列中

当表中的元素都放完后,依次出队,存入原数组,直至MAX轮结束输出数组。

②算法执行过程可视化演示:


由于基数排序较为复杂且变化形式多样,这里的总结文章将不会给出代码

③性能分析:

1.空间效率:排序过程中使用r个队列,所以基数排序的空间复杂度为O(r)

2.时间效率:根据位数的多少,基数排序会进行d趟分配和收集。分配的时间与长度n呈线性关系,收集与队列的多少r有关,分别为O(n)O(r)。所以基数排序的时间复杂度为O(d(n+r)),且与线性表的初始状态无关。

3.稳定性:稳定

4.适用性:适用于线性表为顺序存储和链式存储的情况。


六、对比总结

1.从时间复杂度看

平均情况下的时间复杂度为O(n2)的算法有:简单选择排序、直接插入排序和冒泡排序。(但直接插入排序和冒泡排序最好情况下的时间复杂度可以达到O(n),而简单选择排序则与序列的初始状态无关)

平均情况下的时间复杂度为O(nlog
2n)的算法有:快速排序、堆排序、归并排序(快速排序基于分治的思想,虽然最坏情况下快速排序时间会达到O(n2),但快速排序平均性能可以达到(nlog2n),在实际应用中常常优于其他排序算法。归并排序同样基于分治的思想,但由于其分割子序列与初始序列的排列无关,因此它的最好、最坏和平均时间复杂度均为O(nlog2n)。堆排序利用了一种称为堆的数据结构,可在线性时间内完成建堆)

希尔排序作为插入排序的拓展,对较大规模的排序都可以达到很高的效率,但目前未得出其精确的渐近时间。


基数排序
与其他的都不同,它的最好、最坏和平均时间复杂度均为O(d(n+r))。

2.从空间复杂度看

  • 简单选择排序、插入排序、冒泡排序、希尔排序和堆排序都仅需要借助常数个辅助空间
  • 快速排序在空间上只使用一个小的辅助栈,用于实现递归,平均情况下大小为O(log2n),当然在最坏情况下可能会增长到O(n)。
  • 2路归并排序在合并操作中需要借助较多的辅助空间用于元素复制,大小为O(n)(虽然有方法能克服这个缺点,但其代价是算法会很复杂而且时间复杂度会增加)

3.从稳定性看

  • 插入排序、冒泡排序、归并排序和基数排序是稳定的排序方法
  • 简单选择排序、快速排序、希尔排序和堆排序都是不稳定的排序方法

4.从过程特征看

  • 采用不同的排序算法,在一次循环或几次循环后的排序结果可能是不同的
  • 冒泡排序和堆排序在每趟处理后都能产生当前的最大值或最小值
  • 快速排序一趟处理就能确定一个元素的最终位置

5.性质对比

算法种类 时间复杂度 空间复杂度 稳定性
\ 最好情况 —平均情况—最坏情况 \ \
直接插入排序 O(n)------O(n2)------O(n2) O(1)
冒泡排序 O(n)------O(n2)------O(n2) O(1)
简单选择排序 O(n2)------O(n2)------O(n2) O(1)
快速排序 O(log2n)—O(log2n)—O(n2) O(log2n)
堆排序 O(log2n)—O(log2n)—O(log2n) O(1)
二路归并排序 O(log2n)—O(log2n)—O(log2n) O(n)
基数排序 O(d(n+r))—O(d(n+r))—O(d(n+r)) O( r )
相关文章
|
5月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
320 6
|
1月前
|
存储 算法 Java
算法系列之数据结构-二叉树
树是一种重要的非线性数据结构,广泛应用于各种算法和应用中。本文介绍了树的基本概念、常见类型(如二叉树、满二叉树、完全二叉树、平衡二叉树、B树等)及其在Java中的实现。通过递归方法实现了二叉树的前序、中序、后序和层次遍历,并展示了具体的代码示例和运行结果。掌握树结构有助于提高编程能力,优化算法设计。
62 9
 算法系列之数据结构-二叉树
|
6月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
198 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
1月前
|
算法 Java
算法系列之数据结构-Huffman树
Huffman树(哈夫曼树)又称最优二叉树,是一种带权路径长度最短的二叉树,常用于信息传输、数据压缩等方面。它的构造基于字符出现的频率,通过将频率较低的字符组合在一起,最终形成一棵树。在Huffman树中,每个叶节点代表一个字符,而每个字符的编码则是从根节点到叶节点的路径所对应的二进制序列。
69 3
 算法系列之数据结构-Huffman树
|
2月前
|
存储 搜索推荐 算法
算法系列之排序算法-堆排序
堆排序(Heap Sort)是一种基于堆数据结构的比较排序算法。它的时间复杂度为 $O(nlogn)$,并且是一种原地排序算法(即不需要额外的存储空间)。堆排序的核心思想是利用堆的性质来维护一个最大堆或最小堆,然后逐步将堆顶元素(最大值或最小值)取出,放到数组的末尾,最终得到一个有序的数组。
55 8
算法系列之排序算法-堆排序
|
1月前
|
算法 Java
算法系列之数据结构-二叉搜索树
二叉查找树(Binary Search Tree,简称BST)是一种常用的数据结构,它能够高效地进行查找、插入和删除操作。二叉查找树的特点是,对于树中的每个节点,其左子树中的所有节点都小于该节点,而右子树中的所有节点都大于该节点。
86 22
|
2月前
|
存储 机器学习/深度学习 算法
C 408—《数据结构》算法题基础篇—链表(下)
408考研——《数据结构》算法题基础篇之链表(下)。
114 29
|
2月前
|
存储 算法 C语言
C 408—《数据结构》算法题基础篇—链表(上)
408考研——《数据结构》算法题基础篇之链表(上)。
146 25
|
2月前
|
存储 人工智能 算法
C 408—《数据结构》算法题基础篇—数组(通俗易懂)
408考研——《数据结构》算法题基础篇之数组。(408算法题的入门)
120 23
|
3月前
|
搜索推荐 C语言
数据结构(C语言)之对归并排序的介绍与理解
归并排序是一种基于分治策略的排序算法,通过递归将数组不断分割为子数组,直到每个子数组仅剩一个元素,再逐步合并这些有序的子数组以得到最终的有序数组。递归版本中,每次分割区间为[left, mid]和[mid+1, right],确保每两个区间内数据有序后进行合并。非递归版本则通过逐步增加gap值(初始为1),先对单个元素排序,再逐步扩大到更大的区间进行合并,直至整个数组有序。归并排序的时间复杂度为O(n*logn),空间复杂度为O(n),且具有稳定性,适用于普通排序及大文件排序场景。
下一篇
oss创建bucket