【排序算法】深入解析快速排序(霍尔法&&三指针法&&挖坑法&&优化随机选key&&中位数法&&小区间法&&非递归版本)

本文涉及的产品
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
简介: 【排序算法】深入解析快速排序(霍尔法&&三指针法&&挖坑法&&优化随机选key&&中位数法&&小区间法&&非递归版本)

📝快速排序

快速排序是一种分治算法。它通过一趟排序将数据分割成独立的两部分,然后再分别对这两部分数据进行快速排序。

本文将用3种方法实现:

🌠霍尔法

霍尔法是一种快速排序中常用的单趟排序方法,由霍尔先发现。


它通过选定一个基准数key(通常是第一个元素),然后利用双指针left和right的方式进行排序,right指针先找比key基准值小的数,left然后找比key基准值大的数,找到后将两个数交换位置,同时实现大数右移和小数左移,当left与right相遇就排序完成,然后将下标key的值与left交换,返回基准数key的下标,完成了单趟排序。这一过程使得基准数左侧的元素都比基准数小,右侧的元素都比基准数大。


如图动图展示:

以下是单趟排序的详解图解过程:

  • beginend记录区间的范围,left记录做下标,从左向右遍历,right记录右下标,从右向左遍历,以第一个数key作为基基准值
  • 先让right出发,找比key值小的值,找到就停下来
  • 然后left再出发,找比key大的值,若是找到则停下来,与right的值进行交换
  • 接着right继续找key小的值,找到后才让left找比key大的值,直到left相遇right,此时left会指向同一个数
  • leftright指向的数与key进行交换,单趟排序就完成了,最后将基准值的下标返回

    为啥相遇位置比key要小->右边先走保证的

6.L遇R: R先走,R在比key小的位置停下来了,L没有找到比key大的,就会跟R相遇相遇位置R停下的位置,是比key小的位置

7.R遇L:第一轮以后的,先交换了,L位置的值小于key,R位置的值大于key ,R启动找小,没有找到,跟L相遇了,相遇位置L停下位置,这个位置比key小

第一轮R遇L,那么就是R没有找到小的,直接就一路左移,遇到L,也就是key的位置

代码实现

void Swap(int* px, int* py)
{
  int tmp = *px;
  *px = *py;
  *py = tmp;
}

//Hoare经典随机快排
void QuickSort1(int* a, int left, int right)
{
  // 如果左指针大于等于右指针,表示数组为空或只有一个元素,直接返回
  if (left >= right)
    return;

  // 区间只有一个值或者不存在就是最小子问题
  int begin = left, end = right;// begin和end记录原始整个区间
  // keyi为基准值下标,初始化为左指针
  int keyi = left;

   // 循环从left到right
  while (left < right)
  {
    // right先走,找小,这里和下面的left<right一方面也是为了防止,right一路走出区间,走到left-1越界
    while (left<right && a[right] >= a[keyi])
    {
      --right;
    }
    // 左指针移动,找比基准值大的元素   
    while (left<right && a[left] <= a[keyi])
    {
      ++left;
    }
    Swap(&a[left], &a[right]);
  }
  // 交换左右指针所指元素
  Swap(&a[left], &a[keyi]);
  // 更新基准值下标
  keyi = left;
  
  // 递归排序左右两部分
  //[begin , keyi-1]keyi[keyi+1 , end]
  QuickSort1(a, begin, keyi - 1);
  QuickSort1(a, keyi + 1, end);

}

🌉三指针法

定义一个数组,第一个元素还是key基准值,定义前指针prev指向第一个数,后指针cur指向第二个数,让cur走,然后遍历数组,cur找到大于等于key基准值的数,cur++让cur向前走一步。当cur指针小于key基准值时,后指针加一走一步(++prev),然后交换prev和cur所指的值进行交换,因为这样cur一直都是小于key的值,让他继续向前不断找大的,而prev一直在找小的。依次类推,到cur遍历完数组,完成单趟排序。

如此动图理解:

简单总结:

以下是单趟排序的详解图解过程:

一开始,让prev指向第一个数,cur指向prev的下一位,此时cur位置的数比key基准值小,所以prev加一后,与cur位置的数交换,由于此时prev+1 == cur,自己跟自己交换,交换没变,完了让cur++走下一个位置。

紧接着:

2.cur继续前进,此时来到了7的位置,大于key的值6cur++继续向前走,来到9位置,9还是大于6,OK ! 我curcur++,来到3的位置,也是看到curprev拉开了距离,所以他又叫前后指针,这就体现出来,往下看–》


  1. 此时此刻,我cur的值小于key基准值,先让prev走一步,然后与cur的值交换交换


  2. 同样的步骤,重复上述遍历,直到遍历完数组

  1. cur遍历完数组后,将交换prev的值key的基准值进行交换,交换完,将key的下标更新为prev下标的,然后返回key下标,完成单趟。

    代码如下:
void QuickSort2(int* a, int left, int right)
{
  // 如果左指针大于等于右指针,表示数组为空或只有一个元素,直接返回
  if (left >= right)
    return;
    
  // keyi为基准值下标,初始化为左指针
  int keyi = left;
  
  // prev记录每次交换后的下标
  int prev = left;

  // cur为遍历指针
  int cur = left+1;
  
  // 循环从左指针+1的位置开始到右指针结束
  while (cur <= right)
  {
    // 如果cur位置元素小于基准值,并且prev不等于cur
      // 就将prev和cur位置元素交换
      // 并将prev后移一位
    if (a[cur] < a[keyi] && ++prev != cur)
      Swap(&a[prev], &a[cur]);

    ++cur;//不管是cur小于还是大于,是否交换,cur都后移一位      cur都++
  }
  // 将基准值和prev位置元素交换
  Swap(&a[keyi], &a[prev]);
   // 更新基准值下标为prev
  keyi = prev;
  
  // 递归调用左右两部分
  // [left, keyi-1]keyi[keyi+1, right]
  QuickSort2(a, left, keyi - 1);
  QuickSort2(a, keyi + 1, right);
}

🌠挖坑法

挖坑法也是快速排序的一种单趟排序方法。它也是利用双指针,但与霍尔法不同的是,挖坑法在每次找到比基准数小的元素时,会将其值填入基准数所在的位置,然后将基准数所在的位置作为“坑”,接着从右边开始找比基准数大的元素填入这个“坑”,如此往复,直到双指针相遇。最后,将基准数填入最后一个“坑”的位置。

挖坑法思路:

您提到的挖坑法是一种快速排序的实现方式。


  1. 选择基准值(key),将其值保存到另一个变量pivot中作为"坑"
  2. 从左往右扫描,找到小于基准值的元素,将其值填入"坑"中,然后"坑"向右移动一个位置
  3. 从右往左扫描,找到大于或等于基准值的元素,将其值填入移动后的"坑"中
  4. 重复步骤2和3,直到左右两个指针相遇
  5. 将基准值填入最后一个"坑"位置
  6. 对基准值左右两边递归分治,【begin,key-1】key 【key+1,end】重复上述过程,实现递归排序

与双指针法相比,挖坑法在处理基准值时使用了额外的"坑"变量,简化了元素交换的操作,但思想都是利用基准值将数组分割成两部分。

代码如下:

//挖坑法
void Dig_QuickSort(int* a, int begin, int end)
{
  if (begin >= end)
    return;

  //一趟的实现
  int key = a[begin];
  int pivot = begin;
  int left = begin;
  int right = end;
  while (left < right)
  {
    while (left < right && a[right] >= key)
    {
      right--;
    }
    a[pivot] = a[right];
    pivot = right;
    while (left < right && a[left] <= key)
    {
      left++;
    }
    a[pivot] = a[left];
    pivot = left;
  }

  //补坑位
  a[pivot] = key;
  
  //递归分治
  //[begin, piti - 1] piti [piti + 1, end]
  Dig_QuickSort(a, begin, pivot - 1);
  Dig_QuickSort(a, pivot + 1, end);
}

当你讨厌挖左边的坑,可以试试右边的坑😉:

代码如下:

// 交换元素
void swap(int* a, int* b) 
{
    int t = *a;
    *a = *b;
    *b = t;
}

// 分区操作函数
int partition(int arr[], int low, int high) 
{

    // 取最后一个元素作为基准值
    int pivot = arr[high];

    // 初始化左右索引  
    int i = (low - 1);

    // 从左到右遍历数组
    for (int j = low; j <= high - 1; j++) 
    {

        // 如果当前元素小于或等于基准值
        if (arr[j] <= pivot) 
        {

            // 左索引向右移动一位
            i++;

            // 将当前元素与左索引位置元素交换  
            swap(&arr[i], &arr[j]);
        }
    }

    // 将基准值和左索引位置元素交换
    swap(&arr[i + 1], &arr[high]);

    // 返回基准值的最终位置
    return (i + 1);
}


// 快速排序主函数
void quickSort(int arr[], int low, int high) 
{

    // 如果低位索引小于高位索引,表示需要继续排序
    if (low < high) 
    {

        // 调用分区函数,得到基准值的位置
        int pi = partition(arr, low, high);

        // 对基准值左边子数组递归调用快速排序
        quickSort(arr, low, pi - 1);

        // 对基准值右边子数组递归调用快速排序   
        quickSort(arr, pi + 1, high);
    }
}

// 测试
int main() 
{
    // 测试数据
    int arr1[] = { 5,3,6,2,10,1,4 };
    int n1 = sizeof(arr1) / sizeof(arr1[0]);
    quickSort(arr1, 0, n1 - 1);
    // 输出排序结果
    for (int i = 0; i < n1; i++)
    {
        printf("%d ", arr1[i]);
    }
    printf("\n");

    int arr2[] = { 5,3,6,2,10,1,4,29,44,1,3,4,5,6 };
    int n2 = sizeof(arr2) / sizeof(arr2[0]);
    quickSort(arr2, 0, n2 - 1);
    // 输出排序结果
    for (int i = 0; i < n2; i++)
    {
        printf("%d ", arr2[i]);
    }
    printf("\n");

    // 测试数据
    int arr3[] = { 10,1,4,5,3,6,2,1 };
    int n3 = sizeof(arr3) / sizeof(arr3[0]);
    quickSort(arr3, 0, n3 - 1);
    // 输出排序结果
    for (int i = 0; i < n3; i++)
    {
        printf("%d ", arr3[i]);
    }
    printf("\n");

    return 0;
}

运行启动:

✏️优化快速排序

🌠随机选key

为什么要使用随机数选取key?

避免最坏情况,即每次选择子数组第一个或最后一个元素作为key,这样会导致时间复杂度退化为O(n^2)。

随机化可以减少排序不均匀数据对算法性能的影响。

相比固定选择第一个或最后一个元素,随机选择key可以在概率上提高算法的平均性能。


这里是优化快速排序使用随机数选取key的方法:


  1. 在划分子数组前,随机生成一个[left,right]区间中的随机数randi,
  2. 将随机randi处的元素与区间起始元素left交换
  3. 使用这个随机索引取出子数组中的元素作为keyi。

随机选key逻辑代码:

//快排,随机选key
void QuickSort3(int* a, int left, int right) 
{

  //区间只有一个值或者不存在就是最小子问题
  if (left >= right)
    return;

  int begin = left, end = right;

  //选[left,right]区间中的随机数做key
  int randi = rand() % (right - left + 1);  
  //rand() % N生成0到N-1的随机数
  randi += left;  

  //将随机索引处的元素与区间起始元素交换
  Swap(&a[left], &a[randi]);

  //用交换后的元素作为基准值keyi
  int keyi = left;

  while (left < right) 
  {
    
    //从右向左找小于key的元素
    while (left < right && a[right] >= a[keyi]) 
    {
      --right;
    }
    
    //从左向右找大于key的元素      
    while (left < right && a[left] <= a[keyi]) 
    {
      ++left; 
    }

    //交换元素
    Swap(&a[left], &a[right]);
  }

  //将基准值与交叉点元素交换
  Swap(&a[left], &a[keyi]);
  keyi = left;

  //递归处理子区间
  QuickSort3(a, begin, keyi - 1);
  QuickSort3(a, keyi + 1, end);
}

🌉三位数取中

有无序数列数组的首和尾后,我们只需要在首,中,尾这三个数据中,选择一个排在中间的数据作为基准值(keyi),进行快速排序,减少极端情况,进一步提高快速排序的平均性能。

代码实现:

// 三数取中  left  mid  right
// 大小居中的值,也就是不是最大也不是最小的
int GetMidi(int* a, int left, int right)
{
  int mid = (left + right) / 2;
  
  if (a[left] < a[mid])
  {
    if (a[mid] < a[right])
    {
      return mid;
    }
    else if (a[left] > a[right])
    {
      return left;
    }
    else
    {
      return right;
    }
  }
  else // a[left] > a[mid]
  {
    if (a[mid] > a[right])
    {
      return mid;
    }
    else if (a[left] < a[right])
    {
      return left;
    }
    else
    {
      return right;
    }
  }
}

取中的返回函数接收:

    int begin = left, end = right;
    // 三数取中
    int midi = GetMidi(a, left, right);
    //printf("%d\n", midi);
    Swap(&a[left], &a[midi]);

整体函数实现:

//三数取中  left  mid  right
//大小居中的值,也就是不是最大,也不是最小的
int GetMid(int* a, int left, int right)
{
  int mid = (left + right) / 2;
  
  if (a[left] < a[mid])
  {
    if (a[mid] < a[right])
    {
      return mid;
    }
    else if(a[left] > a[right])
    {
      return left;
    }
    else
    {
      return  right;
    }
  }
  else//a[left] > a[mid]
  {
    if (a[mid] > a[right])
    {
      return mid;
    }
    else if (a[right] > a[left])
    {
      return left;
    }
    else
    {
      return right;
    }
  }
}


void QuickSort4(int* a, int left, int right)
{
  if (left >= right)
    return;

  int begin = left, end = right;
  //三数取中
  int midi = GetMid(a, left, right);
  //printf("%d\n",midi);
  Swap(&a[left], &a[midi]);

  int keyi = left;
  while (left < right)
  {
    while (left < right && a[right] >= a[keyi])
    {
      --right;
    }
    while (left < right && a[left] <= a[keyi])
    {
      ++left;
    }

    Swap(&a[left], &a[right]);
  }

  Swap(&a[left], &a[keyi]);
  keyi = left;

  QuickSort4(a, begin, keyi - 1);
  QuickSort4(a, keyi + 1, end);

}

🌠小区间选择走插入,可以减少90%左右的递归

对于小区间,使用插入排序而不是递归进行快速排序。

在快速排序递归中,检查子问题的区间长度是否小于某个阈值(如10-20),如果区间长度小于阈值,则使用插入排序进行排序,否则使用快速排序递归进行划分。

而这个(如10-20)刚好可以在递归二叉树中体现出来。

如图:

当然从向下建堆优于向上建堆,也可以体现出来:

优点在于:对于小区间,插入排序效率高于快速排序的递归开销大部分数组元素位于小区间中,采用插入排序可以省去90%左右的递归调用,但整体数组规模大时,主要工作还是由快速排序完成

与三数取中进行合用

void QuickSort5(int* a, int left, int right)
{
  if (left >= right)
    return;

  // 小区间选择走插入,可以减少90%左右的递归
  if (right - left + 1 < 10)
  {
    InsertSort(a + left, right - left + 1);
  }
  else
  {
    int begin = left, end = right;
    //三数取中
    int midi = GetMid(a, left, right);
    //printf("%d\n",midi);
    Swap(&a[left], &a[midi]);

    int keyi = left;
    while (left < right)
    {
      while (left < right && a[right] >= a[keyi])
      {
        --right;
      }
      while (left < right && a[left] <= a[keyi])
      {
        ++left;
      }

      Swap(&a[left], &a[right]);
    }

    Swap(&a[left], &a[keyi]);
    keyi = left;

    QuickSort4(a, begin, keyi - 1);
    QuickSort4(a, keyi + 1, end);
  }
}

🌉 快速排序改非递归版本

逻辑原理:

非递归版本的快速排序利用了栈来模拟递归的过程。它的基本思想是:将待排序数组的起始和结束位置压入栈中,然后不断出栈,进行单趟排序,直到栈为空为止。在单趟排序中,选取基准数,将小于基准数的元素移到基准数左边,大于基准数的元素移到基准数右边,并返回基准数的位置。然后根据基准数的位置,将分区的起始和结束位置入栈,继续下一轮排序,直到所有子数组有序。

代码实现步骤:

  1. 初始化一个栈用于保存待排序子数组的起始和结束位置。
  2. 将整个数组的起始和结束位置压入栈中。
  3. 循环执行以下步骤,直到栈为空:

出栈,获取当前待排序子数组的起始和结束位置。

进行单趟排序,选取基准数,并将小于基准数的元素移到左边,大于基准数的元素移到右边。

根据基准数的位置,将分区的起始和结束位置入栈。

4.排序结束。

代码实现

#include "Stack.h"

void QuickSortNonR(int* a, int left, int right)
{
  ST st;
  STInit(&st);
  STPush(&st, right);
  STPush(&st, left);

  while (!STEmpty(&st))
  {
    int begin = STTop(&st);
    STPop(&st);

    int end = STTop(&st);
    STPop(&st);

    //单趟
    int keyi = begin;
    int prev = begin;
    int cur = begin + 1;

    while (cur <= end)
    {
      if (a[cur] < a[keyi] && ++prev != cur)
        Swap(&a[prev], &a[cur]);
      ++cur;
    }

    Swap(&a[prev], &a[keyi]);
    keyi = prev;

    //[begin,keyi-1]keyi[keyi+1,end]
    if (keyi + 1 < end)
    {
      STPush(&st, end);
      STPush(&st, keyi + 1);
    }

    if (keyi - 1 > begin)
    {
      STPush(&st, keyi - 1);
      STPush(&st, begin);
    }
  }
  
  STDestroy(&st);
}

以下是栈的实现:

Stack.c

#include"Stack.h"

void STInit(ST* ps)
{
  assert(ps);

  ps->a = NULL;
  ps->top = 0;
  ps->capacity = 0;
}

void STDestroy(ST* ps)
{
  assert(ps);

  free(ps->a);
  ps->a = NULL;
  ps->top = ps->capacity = 0;
}

// 栈顶
void STPush(ST* ps, STDataType x)
{
  assert(ps);

  // 满了, 扩容
  if (ps->top == ps->capacity)
  {
    int newcapacity = ps->capacity == 0 ? 4 : ps->capacity * 2;
    STDataType* tmp = (STDataType*)realloc(ps->a, newcapacity * sizeof(STDataType));
    if (tmp == NULL)
    {
      perror("realloc fail");
      return;
    }

    ps->a = tmp;
    ps->capacity = newcapacity;
  }

  ps->a[ps->top] = x;
  ps->top++;
}

void STPop(ST* ps)
{
  assert(ps);
  assert(!STEmpty(ps));

  ps->top--;
}

STDataType STTop(ST* ps)
{
  assert(ps);
  assert(!STEmpty(ps));

  return ps->a[ps->top - 1];
}

int STSize(ST* ps)
{
  assert(ps);

  return ps->top;
}

bool STEmpty(ST* ps)
{
  assert(ps);

  return ps->top == 0;
}

栈的头文件实现:

#pragma once

#include<stdio.h>
#include<stdlib.h>
#include<stdbool.h>
#include<assert.h>

typedef int STDataType;
typedef struct Stack
{
  STDataType* a;
  int top;
  int capacity;
}ST;

void STInit(ST* ps);
void STDestroy(ST* ps);

// 栈顶
void STPush(ST* ps, STDataType x);
void STPop(ST* ps);
STDataType STTop(ST* ps);
int STSize(ST* ps);
bool STEmpty(ST* ps);

🚩总结

快速排序的特性总结:

  1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(logN)
  4. 稳定性:不稳定

因此

时间复杂度:O(N*logN)

什么情况快排最坏:有序/接近有序 ->O(N^2)

但是如果加上随机选key或者三数取中选key,最坏情况不会出现,所以这里不看最坏


快排可以很快,你的点赞也可以很快,哈哈哈,感谢💓 💗 💕 💞,喜欢的话可以点个关注,也可以给博主点一个小小的赞😘呀

相关文章
|
2天前
|
搜索推荐 C语言
【排序算法】快速排序升级版--三路快排详解 + 实现(c语言)
本文介绍了快速排序的升级版——三路快排。传统快速排序在处理大量相同元素时效率较低,而三路快排通过将数组分为三部分(小于、等于、大于基准值)来优化这一问题。文章详细讲解了三路快排的实现步骤,并提供了完整的代码示例。
16 4
|
1月前
|
算法 搜索推荐 Shell
数据结构与算法学习十二:希尔排序、快速排序(递归、好理解)、归并排序(递归、难理解)
这篇文章介绍了希尔排序、快速排序和归并排序三种排序算法的基本概念、实现思路、代码实现及其测试结果。
18 1
|
1月前
|
存储 搜索推荐 算法
【排序算法(二)】——冒泡排序、快速排序和归并排序—>深层解析
【排序算法(二)】——冒泡排序、快速排序和归并排序—>深层解析
|
1月前
|
算法 Python
Python算法编程:冒泡排序、选择排序、快速排序
Python算法编程:冒泡排序、选择排序、快速排序
|
18天前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
3天前
|
算法 数据挖掘 数据安全/隐私保护
基于FCM模糊聚类算法的图像分割matlab仿真
本项目展示了基于模糊C均值(FCM)算法的图像分割技术。算法运行效果良好,无水印。使用MATLAB 2022a开发,提供完整代码及中文注释,附带操作步骤视频。FCM算法通过隶属度矩阵和聚类中心矩阵实现图像分割,适用于灰度和彩色图像,广泛应用于医学影像、遥感图像等领域。
|
4天前
|
算法 调度
基于遗传模拟退火混合优化算法的车间作业最优调度matlab仿真,输出甘特图
车间作业调度问题(JSSP)通过遗传算法(GA)和模拟退火算法(SA)优化多个作业在并行工作中心上的加工顺序和时间,以最小化总完成时间和机器闲置时间。MATLAB2022a版本运行测试,展示了有效性和可行性。核心程序采用作业列表表示法,结合遗传操作和模拟退火过程,提高算法性能。
|
5天前
|
存储 算法 决策智能
基于免疫算法的TSP问题求解matlab仿真
旅行商问题(TSP)是一个经典的组合优化问题,目标是寻找经过每个城市恰好一次并返回起点的最短回路。本文介绍了一种基于免疫算法(IA)的解决方案,该算法模拟生物免疫系统的运作机制,通过克隆选择、变异和免疫记忆等步骤,有效解决了TSP问题。程序使用MATLAB 2022a版本运行,展示了良好的优化效果。
|
4天前
|
机器学习/深度学习 算法 芯片
基于GSP工具箱的NILM算法matlab仿真
基于GSP工具箱的NILM算法Matlab仿真,利用图信号处理技术解析家庭或建筑内各电器的独立功耗。GSPBox通过图的节点、边和权重矩阵表示电气系统,实现对未知数据的有效分类。系统使用MATLAB2022a版本,通过滤波或分解技术从全局能耗信号中提取子设备的功耗信息。
|
4天前
|
机器学习/深度学习 算法 5G
基于MIMO系统的SDR-AltMin混合预编码算法matlab性能仿真
基于MIMO系统的SDR-AltMin混合预编码算法通过结合半定松弛和交替最小化技术,优化大规模MIMO系统的预编码矩阵,提高信号质量。Matlab 2022a仿真结果显示,该算法能有效提升系统性能并降低计算复杂度。核心程序包括预编码和接收矩阵的设计,以及不同信噪比下的性能评估。
21 3

推荐镜像

更多
下一篇
无影云桌面