【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(一)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理

一、排序的概念及其运用

1.1 排序的概念

排序是指使用一串记录,按照其中或某些关键字的大小,递增或递减的排序起来的操作(记录是指待排序的具体数据项)。

其中关于排序可以划分为

  • 外部排序:数据元素全部放在内存中的排序
  • 内部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能再内外存之间移动数据的排序

1.2 排序的稳定性

假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

1.3 排序的运用


二、常见的排序算法

2.1 排序实现的接口

#pragma once
#include <time.h>
#include<stdlib.h>
#include <stdio.h>
// 排序实现的接口
// 插入排序
void InsertSort(int* a, int n);
// 希尔排序
void ShellSort(int* a, int n);
// 选择排序
void SelectSort(int* a, int n);
// 堆排序
void AdjustDwon(int* a, int n, int root);
void HeapSort(int* a, int n);
// 冒泡排序
void BubbleSort(int* a, int n)
// 快速排序递归实现
// 快速排序hoare版本
int PartSort1(int* a, int left, int right);
// 快速排序挖坑法
int PartSort2(int* a, int left, int right);
// 快速排序前后指针法
int PartSort3(int* a, int left, int right);
void QuickSort(int* a, int left, int right);
// 快速排序 非递归实现
void QuickSortNonR(int* a, int left, int right)
// 归并排序递归实现
void MergeSort(int* a, int n)
// 归并排序非递归实现
void MergeSortNonR(int* a, int n)
// 计数排序
void CountSort(int* a, int n)
// 测试排序的性能对比
void TestOP()
{
    srand(time(0));
    const int N = 100000;
    int* a1 = (int*)malloc(sizeof(int) * N);
    int* a2 = (int*)malloc(sizeof(int) * N);
    int* a3 = (int*)malloc(sizeof(int) * N);
    int* a4 = (int*)malloc(sizeof(int) * N);
    int* a5 = (int*)malloc(sizeof(int) * N);
    int* a6 = (int*)malloc(sizeof(int) * N);
    for (int i = 0; i < N; ++i)
    {
        a1[i] = rand();
        a2[i] = a1[i];
        a3[i] = a1[i];
        a4[i] = a1[i];
        a5[i] = a1[i];
        a6[i] = a1[i];
    }
    int begin1 = clock();
    InsertSort(a1, N);
    int end1 = clock();
    int begin2 = clock();
    ShellSort(a2, N);
    int end2 = clock();
    int begin3 = clock();
    SelectSort(a3, N);
    int end3 = clock();
    int begin4 = clock();
    HeapSort(a4, N);
    int end4 = clock();
    int begin5 = clock();
    QuickSort(a5, 0, N - 1);
    int end5 = clock();
    int begin6 = clock();
    MergeSort(a6, N);
    int end6 = clock();
    printf("InsertSort:%d\n", end1 - begin1);
    printf("ShellSort:%d\n", end2 - begin2);
    printf("SelectSort:%d\n", end3 - begin3);
    printf("HeapSort:%d\n", end4 - begin4);
    printf("QuickSort:%d\n", end5 - begin5);
    printf("MergeSort:%d\n", end6 - begin6);
    free(a1);
    free(a2);
    free(a3);
    free(a4);
    free(a5);
    free(a6);
}

三、常见排序算法的实现

关于排序算法,我们都是通过先局部(单趟)再整体去理解整段逻辑。

3.1 插入排序(InsertSort)

基本思路:将待排序的数值,根据序列中大小关系,逐渐插入到一个已经有序序列中,直到所有数据插入完为止,得到新的有序序列。实际中玩扑克牌时,就用了插入排序的思想

void InsertSort(int* a, int n)
{
  //[0,end] end+1//下标的意思
  //循环结束的条件 end>0或者找到插入目标
  //end从0开始[0,0]
  for (int i = 0; i < n - 1; i++)
  {
    int end = i;
    int tmp = a[end + 1]; 
    while (end >= 0 && tmp < a[end])//当出现大于前面有序的数据停下,>就是倒过来
    {
      a[end + 1] = a[end];
      end--;
    }
    a[end + 1] = tmp;
  }
};

过程解析:

我们可以通过扑克牌排序的过程去理解插入排序,比如现在我们手上有一副扑克牌可以分为两个部分:有序部分和所需插入记录

将这两个部分划分区间得到[0, end] [end + 1 , size_max-1],代码逻辑是将待插入元素用临时变量tmp记录起来,通过条判断进行数组元素覆盖移动,为待插入元素找到合适的位置。这里需要注意的部分为循环条件是到[0, n - 2]属于有序部分,关于n-1为最后待插入数据。

这里我们还需要考虑下越界访问的情况,由于待插入数据为当前有序区间中最小数值,在匹配过程中不能单纯从大小判断去完成移动,同时需要对end>=0的限制,表示完成了有序区间内数据的比较,结果为最小值需要在最前面插入。

直接插入排序的特点总结:

  • 元素集合越接近有序,直接插入排序算法的时间效率越高
  • 时间复杂度:逆序O(N2)、顺序有序O(N)
  • 空间复杂度: O(1)
  • 稳定性:稳定

3.2 希尔排序(缩小增量排序)

基本思路:通过预排序使得无序接近有序序列,大体流程:先选定一个整数gap,将待排序序列中所有记录分组,所有距离为gap记录分在同一组,并对每一组记录进行排序,重复上述分组和排序的工作(gap不断缩小),当gap到达1,此时记录已经接近有序,最后整体进行插入排序,使得记录排好序。

希尔排序分为两部分:

  • 预排序:分布对每组进行插入排序,当gap>1时,目的让他接近有序
  • 直接插入排序:当gap==1时,目的是让他有序

关于gap的取数,有两种选择:

  • gap=gap/2;
  • gap=gap/3+1;

3.2.1 预排序

单组排序:

int gap=3;//规定每隔三个空为一组,单独插入排序
for(int j=0;j<gap;j++)//一共有三组
{
  for(int i=j;i<n-gap;i+=gap)//每一组之间的插入排序
    {
        int end=i;
        int tmp=a[end+gap];
        while(end>=0)
        {
      if(tmp<a[end])
            {
                a[end+gap]=a[end];
                end-=gap;
            }
            else
                break;
        }
        a[end+gap]=tmp;
    }
}

这里使用下标(N- gap) -1作为分界线,是为了方便大家理解这里内层循环条件为什么这样子写,而实际中分组是通过数据去划分的,需要大家从下标转化到对应数值中。关于第二层循环i,这里是根据(n - gap - 1)+ gap = n - 1为最后一个待排序元,比如红色、蓝色、绿最后一个元素超过了当前分界线说明这就是它们分组的最后一个元素,如果继续i+=gap就会发生越界访问。

希尔排序是对于插入排序的优化,对此逻辑上跟插入排序没有太大区别。区别在于希尔排序先用了预排序使得无序序列变得接近有序序列,

多组同时排序(每组并不是单独阶段完全处理)

int gap=3;//规定每隔三个空为一组,单独插入排序
  for(int i=j;i<n-gap;i++)//多个组同时排序
    {
        int end=i;
        int tmp=a[end+gap];
        while(end>=0)
        {
      if(tmp<a[end])
            {
                a[end+gap]=a[end];
                end-=gap;
            }
            else
                break;
        }
        a[end+gap]=tmp;
    }

过程解析:

  • gap越大,大的值越快调到后面,小的值可以更快的调到前面,越不接近有序
  • gap越小,跳得越慢,但是越接近有序。如果gap==1就是直接插入排序

整理过程(上述属于单躺排序)

int gap = n;
  while (gap > 1)
  {
        //gap不断发生变换
    gap =gap / 3 + 1;
    for (int i = 0; i < n - gap; i++)//多组
    {
      int end = i;
      int tmp = a[end + gap];
      while (end >= 0 && tmp < a[end])
      {
        a[end + gap] = a[end];
        end -= gap;
      }
      a[end + gap] = tmp;
    }
  }
}

每次预排序都会产生作用,意味着上一组预排序会影响下一组预排序导致影响时间复杂度.

希尔排序的特点总结:

  • 希尔排序是对直接插入排序的优化。
  • 当gap>1时都是属于预排序,目的是让数组更接近有序。
  • 当gap=1时,数据已经接近有序,就是简单插入排序,直接插入排序算法的时间效率越高
  • 稳定性:不稳定

3.2.2 关于希尔排序时间复杂度

希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都是不固定的

《数据结构(C语言版)》— 严蔚敏

《数据结构-用面相对象方法与C++描述》— 殷人昆

小总结:

  • 插入排序:数据量小或已经部分排序,足够好且实现简单
  • 希尔排序:数据量大,希尔排序通常能提供更好的性能


【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(二)https://developer.aliyun.com/article/1617281

相关文章
|
28天前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
41 3
|
18天前
|
存储 消息中间件 NoSQL
Redis数据结构:List类型全面解析
Redis数据结构——List类型全面解析:存储多个有序的字符串,列表中每个字符串成为元素 Eelement,最多可以存储 2^32-1 个元素。可对列表两端插入(push)和弹出(pop)、获取指定范围的元素列表等,常见命令。 底层数据结构:3.2版本之前,底层采用**压缩链表ZipList**和**双向链表LinkedList**;3.2版本之后,底层数据结构为**快速链表QuickList** 列表是一种比较灵活的数据结构,可以充当栈、队列、阻塞队列,在实际开发中有很多应用场景。
|
16天前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
31 1
|
21天前
|
数据采集 存储 编解码
一份简明的 Base64 原理解析
Base64 编码器的原理,其实很简单,花一点点时间学会它,你就又消除了一个知识盲点。
59 3
|
3天前
|
存储 供应链 物联网
深入解析区块链技术的核心原理与应用前景
深入解析区块链技术的核心原理与应用前景
|
3天前
|
存储 供应链 安全
深度解析区块链技术的核心原理与应用前景
深度解析区块链技术的核心原理与应用前景
10 0
|
1月前
|
开发框架 缓存 前端开发
electron-builder 解析:你了解其背后的构建原理吗?
本文首发于微信公众号“前端徐徐”,详细解析了 electron-builder 的工作原理。electron-builder 是一个专为整合前端项目与 Electron 应用的打包工具,负责管理依赖、生成配置文件及多平台构建。文章介绍了前端项目的构建流程、配置信息收集、依赖处理、asar 打包、附加资源准备、Electron 打包、代码签名、资源压缩、卸载程序生成、安装程序生成及最终安装包输出等环节。通过剖析 electron-builder 的原理,帮助开发者更好地理解和掌握跨端桌面应用的构建流程。
79 2
|
18天前
|
存储 NoSQL 关系型数据库
Redis的ZSet底层数据结构,ZSet类型全面解析
Redis的ZSet底层数据结构,ZSet类型全面解析;应用场景、底层结构、常用命令;压缩列表ZipList、跳表SkipList;B+树与跳表对比,MySQL为什么使用B+树;ZSet为什么用跳表,而不是B+树、红黑树、二叉树
|
18天前
|
供应链 安全 分布式数据库
探索区块链技术:从原理到应用的全面解析
【10月更文挑战第22天】 本文旨在深入浅出地探讨区块链技术,一种近年来引起广泛关注的分布式账本技术。我们将从区块链的基本概念入手,逐步深入到其工作原理、关键技术特点以及在金融、供应链管理等多个领域的实际应用案例。通过这篇文章,读者不仅能够理解区块链技术的核心价值和潜力,还能获得关于如何评估和选择适合自己需求的区块链解决方案的实用建议。
37 0
|
30天前
|
前端开发 JavaScript UED
axios取消请求CancelToken的原理解析及用法示例
axios取消请求CancelToken的原理解析及用法示例
86 0

推荐镜像

更多