【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(一)

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理

一、排序的概念及其运用

1.1 排序的概念

排序是指使用一串记录,按照其中或某些关键字的大小,递增或递减的排序起来的操作(记录是指待排序的具体数据项)。

其中关于排序可以划分为

  • 外部排序:数据元素全部放在内存中的排序
  • 内部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能再内外存之间移动数据的排序

1.2 排序的稳定性

假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

1.3 排序的运用


二、常见的排序算法

2.1 排序实现的接口

#pragma once
#include <time.h>
#include<stdlib.h>
#include <stdio.h>
// 排序实现的接口
// 插入排序
void InsertSort(int* a, int n);
// 希尔排序
void ShellSort(int* a, int n);
// 选择排序
void SelectSort(int* a, int n);
// 堆排序
void AdjustDwon(int* a, int n, int root);
void HeapSort(int* a, int n);
// 冒泡排序
void BubbleSort(int* a, int n)
// 快速排序递归实现
// 快速排序hoare版本
int PartSort1(int* a, int left, int right);
// 快速排序挖坑法
int PartSort2(int* a, int left, int right);
// 快速排序前后指针法
int PartSort3(int* a, int left, int right);
void QuickSort(int* a, int left, int right);
// 快速排序 非递归实现
void QuickSortNonR(int* a, int left, int right)
// 归并排序递归实现
void MergeSort(int* a, int n)
// 归并排序非递归实现
void MergeSortNonR(int* a, int n)
// 计数排序
void CountSort(int* a, int n)
// 测试排序的性能对比
void TestOP()
{
    srand(time(0));
    const int N = 100000;
    int* a1 = (int*)malloc(sizeof(int) * N);
    int* a2 = (int*)malloc(sizeof(int) * N);
    int* a3 = (int*)malloc(sizeof(int) * N);
    int* a4 = (int*)malloc(sizeof(int) * N);
    int* a5 = (int*)malloc(sizeof(int) * N);
    int* a6 = (int*)malloc(sizeof(int) * N);
    for (int i = 0; i < N; ++i)
    {
        a1[i] = rand();
        a2[i] = a1[i];
        a3[i] = a1[i];
        a4[i] = a1[i];
        a5[i] = a1[i];
        a6[i] = a1[i];
    }
    int begin1 = clock();
    InsertSort(a1, N);
    int end1 = clock();
    int begin2 = clock();
    ShellSort(a2, N);
    int end2 = clock();
    int begin3 = clock();
    SelectSort(a3, N);
    int end3 = clock();
    int begin4 = clock();
    HeapSort(a4, N);
    int end4 = clock();
    int begin5 = clock();
    QuickSort(a5, 0, N - 1);
    int end5 = clock();
    int begin6 = clock();
    MergeSort(a6, N);
    int end6 = clock();
    printf("InsertSort:%d\n", end1 - begin1);
    printf("ShellSort:%d\n", end2 - begin2);
    printf("SelectSort:%d\n", end3 - begin3);
    printf("HeapSort:%d\n", end4 - begin4);
    printf("QuickSort:%d\n", end5 - begin5);
    printf("MergeSort:%d\n", end6 - begin6);
    free(a1);
    free(a2);
    free(a3);
    free(a4);
    free(a5);
    free(a6);
}

三、常见排序算法的实现

关于排序算法,我们都是通过先局部(单趟)再整体去理解整段逻辑。

3.1 插入排序(InsertSort)

基本思路:将待排序的数值,根据序列中大小关系,逐渐插入到一个已经有序序列中,直到所有数据插入完为止,得到新的有序序列。实际中玩扑克牌时,就用了插入排序的思想

void InsertSort(int* a, int n)
{
  //[0,end] end+1//下标的意思
  //循环结束的条件 end>0或者找到插入目标
  //end从0开始[0,0]
  for (int i = 0; i < n - 1; i++)
  {
    int end = i;
    int tmp = a[end + 1]; 
    while (end >= 0 && tmp < a[end])//当出现大于前面有序的数据停下,>就是倒过来
    {
      a[end + 1] = a[end];
      end--;
    }
    a[end + 1] = tmp;
  }
};

过程解析:

我们可以通过扑克牌排序的过程去理解插入排序,比如现在我们手上有一副扑克牌可以分为两个部分:有序部分和所需插入记录

将这两个部分划分区间得到[0, end] [end + 1 , size_max-1],代码逻辑是将待插入元素用临时变量tmp记录起来,通过条判断进行数组元素覆盖移动,为待插入元素找到合适的位置。这里需要注意的部分为循环条件是到[0, n - 2]属于有序部分,关于n-1为最后待插入数据。

这里我们还需要考虑下越界访问的情况,由于待插入数据为当前有序区间中最小数值,在匹配过程中不能单纯从大小判断去完成移动,同时需要对end>=0的限制,表示完成了有序区间内数据的比较,结果为最小值需要在最前面插入。

直接插入排序的特点总结:

  • 元素集合越接近有序,直接插入排序算法的时间效率越高
  • 时间复杂度:逆序O(N2)、顺序有序O(N)
  • 空间复杂度: O(1)
  • 稳定性:稳定

3.2 希尔排序(缩小增量排序)

基本思路:通过预排序使得无序接近有序序列,大体流程:先选定一个整数gap,将待排序序列中所有记录分组,所有距离为gap记录分在同一组,并对每一组记录进行排序,重复上述分组和排序的工作(gap不断缩小),当gap到达1,此时记录已经接近有序,最后整体进行插入排序,使得记录排好序。

希尔排序分为两部分:

  • 预排序:分布对每组进行插入排序,当gap>1时,目的让他接近有序
  • 直接插入排序:当gap==1时,目的是让他有序

关于gap的取数,有两种选择:

  • gap=gap/2;
  • gap=gap/3+1;

3.2.1 预排序

单组排序:

int gap=3;//规定每隔三个空为一组,单独插入排序
for(int j=0;j<gap;j++)//一共有三组
{
  for(int i=j;i<n-gap;i+=gap)//每一组之间的插入排序
    {
        int end=i;
        int tmp=a[end+gap];
        while(end>=0)
        {
      if(tmp<a[end])
            {
                a[end+gap]=a[end];
                end-=gap;
            }
            else
                break;
        }
        a[end+gap]=tmp;
    }
}

这里使用下标(N- gap) -1作为分界线,是为了方便大家理解这里内层循环条件为什么这样子写,而实际中分组是通过数据去划分的,需要大家从下标转化到对应数值中。关于第二层循环i,这里是根据(n - gap - 1)+ gap = n - 1为最后一个待排序元,比如红色、蓝色、绿最后一个元素超过了当前分界线说明这就是它们分组的最后一个元素,如果继续i+=gap就会发生越界访问。

希尔排序是对于插入排序的优化,对此逻辑上跟插入排序没有太大区别。区别在于希尔排序先用了预排序使得无序序列变得接近有序序列,

多组同时排序(每组并不是单独阶段完全处理)

int gap=3;//规定每隔三个空为一组,单独插入排序
  for(int i=j;i<n-gap;i++)//多个组同时排序
    {
        int end=i;
        int tmp=a[end+gap];
        while(end>=0)
        {
      if(tmp<a[end])
            {
                a[end+gap]=a[end];
                end-=gap;
            }
            else
                break;
        }
        a[end+gap]=tmp;
    }

过程解析:

  • gap越大,大的值越快调到后面,小的值可以更快的调到前面,越不接近有序
  • gap越小,跳得越慢,但是越接近有序。如果gap==1就是直接插入排序

整理过程(上述属于单躺排序)

int gap = n;
  while (gap > 1)
  {
        //gap不断发生变换
    gap =gap / 3 + 1;
    for (int i = 0; i < n - gap; i++)//多组
    {
      int end = i;
      int tmp = a[end + gap];
      while (end >= 0 && tmp < a[end])
      {
        a[end + gap] = a[end];
        end -= gap;
      }
      a[end + gap] = tmp;
    }
  }
}

每次预排序都会产生作用,意味着上一组预排序会影响下一组预排序导致影响时间复杂度.

希尔排序的特点总结:

  • 希尔排序是对直接插入排序的优化。
  • 当gap>1时都是属于预排序,目的是让数组更接近有序。
  • 当gap=1时,数据已经接近有序,就是简单插入排序,直接插入排序算法的时间效率越高
  • 稳定性:不稳定

3.2.2 关于希尔排序时间复杂度

希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都是不固定的

《数据结构(C语言版)》— 严蔚敏

《数据结构-用面相对象方法与C++描述》— 殷人昆

小总结:

  • 插入排序:数据量小或已经部分排序,足够好且实现简单
  • 希尔排序:数据量大,希尔排序通常能提供更好的性能


【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(二)https://developer.aliyun.com/article/1617281

相关文章
|
1天前
|
搜索推荐 索引
【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(二)
【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理
|
1天前
|
人工智能 搜索推荐 算法
【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理(三)
【初阶数据结构】深度解析七大常见排序|掌握底层逻辑与原理
|
2月前
|
监控 网络协议 Java
Tomcat源码解析】整体架构组成及核心组件
Tomcat,原名Catalina,是一款优雅轻盈的Web服务器,自4.x版本起扩展了JSP、EL等功能,超越了单纯的Servlet容器范畴。Servlet是Sun公司为Java编程Web应用制定的规范,Tomcat作为Servlet容器,负责构建Request与Response对象,并执行业务逻辑。
Tomcat源码解析】整体架构组成及核心组件
|
2月前
|
存储 NoSQL Redis
redis 6源码解析之 object
redis 6源码解析之 object
58 6
|
25天前
|
存储 缓存 Java
什么是线程池?从底层源码入手,深度解析线程池的工作原理
本文从底层源码入手,深度解析ThreadPoolExecutor底层源码,包括其核心字段、内部类和重要方法,另外对Executors工具类下的四种自带线程池源码进行解释。 阅读本文后,可以对线程池的工作原理、七大参数、生命周期、拒绝策略等内容拥有更深入的认识。
什么是线程池?从底层源码入手,深度解析线程池的工作原理
|
29天前
|
开发工具
Flutter-AnimatedWidget组件源码解析
Flutter-AnimatedWidget组件源码解析
148 60
|
25天前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
214 37
|
3天前
|
Java Spring 容器
Spring IOC、AOP与事务管理底层原理及源码解析
Spring框架以其强大的控制反转(IOC)和面向切面编程(AOP)功能,成为Java企业级开发中的首选框架。本文将深入探讨Spring IOC和AOP的底层原理,并通过源码解析来揭示其实现机制。同时,我们还将探讨Spring事务管理的核心原理,并给出相应的源码示例。
30 9
|
17天前
|
编解码 开发工具 UED
QT Widgets模块源码解析与实践
【9月更文挑战第20天】Qt Widgets 模块是 Qt 开发中至关重要的部分,提供了丰富的 GUI 组件,如按钮、文本框等,并支持布局管理、事件处理和窗口管理。这些组件基于信号与槽机制,实现灵活交互。通过对源码的解析及实践应用,可深入了解其类结构、布局管理和事件处理机制,掌握创建复杂 UI 界面的方法,提升开发效率和用户体验。
79 12
|
2月前
|
测试技术 Python
python自动化测试中装饰器@ddt与@data源码深入解析
综上所述,使用 `@ddt`和 `@data`可以大大简化写作测试用例的过程,让我们能专注于测试逻辑的本身,而无需编写重复的测试方法。通过讲解了 `@ddt`和 `@data`源码的关键部分,我们可以更深入地理解其背后的工作原理。
35 1

推荐镜像

更多