【数据结构】八大排序之快速排序算法

简介: 【数据结构】八大排序之快速排序算法

一.快速排序简介及思想

快速排序(Quick Sort)是一种效率较高的交换排序算法.

它的基本思想是:

  • 通过一趟排序将待排数据分割成独立的两部分
  • 其中一部分数据的关键字均比另一部分数据的关键字小
  • 可分别对这两部分数据继续进行排序,以达到整个序列有序的目的.

算法动图演示:


二.快速排序代码实现的三种方式

我们了解了快速排序的基本思想通过一趟排序将待排数据分割成独立的两部分之后,在代码的实现上,其实就有很多可以自由发挥的空间,如下较为主流的快速排序有三种实现思路,接下来我将一一带大家理解这三个思路并使用它们实现快排算法:

注:本文的快排实现思路均以升序为例!

📌左右交换法

左右交换法的思路是:

  1. 先选定当前待排序列的首元素位置的值为基准值(key).
  2. 然后设置一个右指针,使其从后向前遍历,找到比基准值(key)小的元素就停下来.
  3. 再设置一个左指针,使其从前向后遍历,找到比基准值(key)大的元素就停下来.
  4. 当左右指针都找到相应元素时,交换它们找到的元素.
  5. 重复步骤2~4,直到左右指针相遇
  6. 左右指针相遇后,将基准值(key)与相遇位置做交换,此时数组已经被重新一分为二成两个新的待排子序列.
  7. 分别继续对新的待排子序列继续执行步骤1~6排序,直到所有元素都排列在相应位置上为止.

左右交换法算法演示:

清楚了左右交换法实现快排的思路后,我们编写实现代码就比较容易了,代码如下:

//交换函数
void Swap(int* a, int* b)
{
  int tmp = *a;
  *a = *b;
  *b = tmp;
}
 
//快速排序(左右交换法
void QuickSort_swap(int* a, int left, int right)
{
  if (left >= right)
    return;
  int begin = left, end = right;
 
  int keyi = left;//选定序列首元素为基准值
 
  while (left < right)
  {
    //右边找小
    while (left < right && a[right] >= a[keyi])
      right--;
    //左边找大
    while (left < right && a[left] <= a[keyi])
      left++;
    //交换
    Swap(&a[left], &a[right]);
  }
  //相遇时交换key和相遇位置的值
  Swap(&a[keyi], &a[left]);
 
  keyi = left;//用keyi记录下本轮确定的基准值位置
 
  QuickSort_swap(a, begin, keyi - 1);//递归排序左区间[begin , keyi-1]
  QuickSort_swap(a, keyi + 1, end);//递归排序右区间[keyi+1 , end]
}

📌挖坑填坑法

挖坑填坑法是基于快排的基础思想提出的一种创新实现的思路,它的思路是这样的:

  1. 记录下当前待排序列的首元素为基准值(key).
  2. 此时认为首元素的位置空缺的,即该位置成为了一个坑.
  3. 设置一个右指针,使其从后向前遍历,找到比基准值(key)小的元素停下来将其填入刚才的坑位中,此时认为右指针找到的这个元素位置又形成了一个坑.
  4. 设置一个左指针,使其从前向后遍历,找到比基准值(key)大的元素停下来将其填入刚才的坑位中,此时认为左指针找到的这个元素位置又形成了一个坑.
  5. 左右指针不断向中间挪动不断填坑又形成新坑,直到两指针相遇
  6. 最后将基准值(key)填入左右指针相遇位置的坑中,此时数组已经被重新一分为二成两个新的待排子序列.
  7. 分别继续对新的待排子序列继续执行步骤1~6排序,直到所有元素都排列在相应位置上为止.

挖坑填坑法算法演示:

挖坑填坑法实现快排代码如下:

//快速排序(挖坑填坑法
void QuickSort_hole(int* a, int left, int right)
{
  if (left >= right)
    return;
  int begin = left, end = right;
 
  int key = a[left];//选定序列首元素为基准值,记录下基准值
  int hole = left;  //基准值的位置形成坑位
 
  while (left < right)
  {
    //右边找小
    while (left < right && a[right] >= key)
      right--;
 
    //找到了就填坑,更新坑
    a[hole] = a[right];
    hole = right;
 
    //左边找大
    while (left < right && a[left] <= key)
      left++;
 
    //找到了就填坑,更新坑
    a[hole] = a[left];
    hole = left;
  }
 
  //相遇时把key的值填进相遇的坑里
  a[hole] = key;
 
  QuickSort_hole(a, begin, hole - 1);//递归遍历左区间[begin , hole-1]
  QuickSort_hole(a, hole + 1, end);//递归遍历右区间[hole+1 , end]
}

📌前后指针法

前后指针法思路为:

  1. 先选定当前待排序列的首元素位置的值为基准值(key).
  2. 设立前指针prev,使其指向序列开头,即基准值位置
  3. 设立后指针cur,使其指向prev指针的后一个位置
  4. 判断cur指向的数据是否小于key:如果小于,则prev后移一位,然后将cur指向的内容与prev指向的内容交换, 然后cur指针++;如果不小于,则cur++.
  5. 循环步骤4,直到cur移动到超出序列范围时,交换prev位置和基准位置的值,此时数组已经被重新一分为二成两个新的待排子序列.
  6. 分别继续对新的待排子序列继续执行步骤1~5排序,直到所有元素都排列在相应位置上为止.

前后指针法算法演示:

前后指针法实现快排代码如下:

//交换
void Swap(int* a, int* b)
{
  int tmp = *a;
  *a = *b;
  *b = tmp;
}
 
//快速排序(前后指针法
void QuickSort_follow(int* a, int left, int right)
{
  if (left >= right)
    return;
  int begin = left, end = right;
 
  int keyi = left;//选定序列首元素为基准值,记录下基准值位置
 
  int prev = left;
  int cur = prev + 1;
 
  while (cur <= right) //cur没有越界就继续
  {
    if (a[cur] < a[keyi] && ++prev != cur) //如果cur指向的值小于key,并且++prev与cur不重叠
    {
      Swap(&a[cur], &a[prev]);  //就交换它们
    }
    cur++; 
  }
 
  Swap(&a[prev], &a[keyi]);//交换prev和key的值
  keyi = prev;
 
  QuickSort_follow(a, begin, keyi - 1);//递归遍历左区间[begin , keyi-1]
  QuickSort_follow(a, keyi + 1, end);//递归遍历右区间[keyi+1 , end]
}

三.快速排序的时间复杂度分析

"快速排序的平均时间为 ,其中n为待排序序列中数据的个数,k为某个常数,经验证明,在所有同数量级的此类(先进的)排序算法中,快速排序的常数因子k最小.因此,就平均时间而言,快速排序是目前被认为最好的一种内部排序方法.

通常,快速排序被认为是,在所有同数量级(O(nlogn))的排序算法中,其平均性能最好.但是,若初始数据序列按关键字有序或基本有序时,快速排序将蜕化为冒泡排序,其时间复杂度为O(n^2)."

                               ——《数据结构》严蔚敏

也就是说,快排的时间复杂度我们可以认为是O(nlogn),但当遇到原数组本身有序的情况下,其时间复杂度就会退化至O(n^2),这个其实很好理解,举个例子就明白了:

最优情况下,即每趟选择key时都恰好选择到数组的中间值时(第n层可以确定 个数字位置),快排的时间复杂度如下图完全(满)二叉树:

该树每层需要遍历一遍数组,时间复杂度为n,而树高为 ,因此最优状态下快排的时间复杂度仅为O(nlogn).

最坏情况下,即每趟选择key时都恰好选择到数组最大或最小的值时(即每一层都只能确定一个数字位置),快排的时间复杂度如下单支树:

树每层遍历一遍数组,时间复杂度为n,而树高也为n,因此最坏状态下快排的时间复杂度为O(n^2).

综上,对快排时间复杂度的分析,我们不光理解了为什么快排排先天有序的数组时反而效率最差,同样也为我们后续对快排算法的优化提供了思路.


四.快速排序的优化

🎏优化选key方式

既然在快排在面对原本就接近有序的数组时排序会因为key值的选取导致效率降低,那么我们不妨优化一下我们快排时选key的方式,下面为大家介绍两种常用的优化选key的方式:

📌随机选key法

随机选key的思路为:

  1. 先使用rand()函数随机选出一个在[left,right]范围内的下标值randi
  2. 将randi下标的数据和keyi下标的数据互换

随机选key函数的实现:

//随机选key法
void SwapRand_key(int* a,int left, int right)
{
     int randi = left + (rand() % (right - left));
   Swap(&a[left], &a[randi]);
}

结合随机选key法实现快排

我们写好随机选key函数后只需要在正常快排函数中选定keyi后(如下函数的第15行后)调用一下随机选keyi函数就可以将随机选出的key值和原本的key值做交换了.

实现代码如下:

//随机选key法
void SwapRand_key(int* a,int left, int right)
{
     int randi = left + (rand() % (right - left));
   Swap(&a[left], &a[randi]);
}
 
//快速排序(前后指针法
void QuickSort_follow(int* a, int left, int right)
{
  if (left >= right)
    return;
  int begin = left, end = right;
 
  int keyi = left;    //选定序列首元素为基准值,记录下基准值
 
  SwapRand_key(a,left, right);  //随机选出一个数据交换基准值key
  
  int prev = left;
  int cur = prev + 1;
 
  while (cur <= right)
  {
    if (a[cur] < a[keyi] && ++prev != cur)
    {
      Swap(&a[cur], &a[prev]);
    }
    cur++;
  }
  Swap(&a[prev], &a[keyi]);
  keyi = prev;
 
  QuickSort_follow(a, begin, keyi - 1);//递归遍历左区间[begin , keyi-1]
  QuickSort_follow(a, keyi + 1, end);//递归遍历右区间[keyi+1 , end]
}

📌三数取中法

三数取中法的思路是:

  1. 比较序列首元素,尾元素,中间元素,取三者中的中间值作为midi
  2. 将midi下标的数据和keyi下标的数据互换

三数取中函数的实现:

//三数取中法
void SwapMid_key(int* a, int left, int right)
{
  int midi = (left + right) / 2;
  if (a[left] < a[midi])
  {
    if (a[midi] < a[right])
    {
      midi = midi;
    }
    else if (a[left] > a[right])
    {
      midi = left;
    }
    else 
    {
      midi = right;
    }
  }
  else // a[left] > a[mid]
  {
    if (a[midi] > a[right])
    {
      midi = midi;
    }
    else if (a[left] < a[right])
    {
      midi = left;
    }
    else
    {
      midi = right;
    }
  }
 
  if (midi != left)
    Swap(&a[midi], &a[left]);
}

结合三数取中法实现快排

我们写好三数取中函数后只需要在正常快排函数中选定keyi后(如下函数的第45行后)调用一下三数取中函数就可以将三数取中选出的key值和原本的key值做交换了.

实现代码如下:

//三数取中函数
void SwapMid_key(int* a, int left, int right)
{
  int midi = (left + right) / 2;
  if (a[left] < a[midi])
  {
    if (a[midi] < a[right])
    {
      midi = midi;
    }
    else if (a[left] > a[right])
    {
      midi = left;
    }
    else 
    {
      midi = right;
    }
  }
  else // a[left] > a[mid]
  {
    if (a[midi] > a[right])
    {
      midi = midi;
    }
    else if (a[left] < a[right])
    {
      midi = left;
    }
    else
    {
      midi = right;
    }
  }
  if (midi != left)
    Swap(&a[midi], &a[left]);
}
 
//快速排序(前后指针法
void QuickSort_follow(int* a, int left, int right)
{
  if (left >= right)
    return;
  int begin = left, end = right;
 
  int keyi = left;    //选定序列首元素为基准值,记录下基准值
 
  SwapMid_key(a, left, right);   //三数取中法选出基准值后交换基准值
 
  int prev = left;
  int cur = prev + 1;
 
  while (cur <= right)
  {
    if (a[cur] < a[keyi] && ++prev != cur)
    {
      Swap(&a[cur], &a[prev]);
    }
    cur++;
  }
  Swap(&a[prev], &a[keyi]);
  keyi = prev;
 
  QuickSort_follow(a, begin, keyi - 1);//递归遍历左区间[begin , keyi-1]
  QuickSort_follow(a, keyi + 1, end);//递归遍历右区间[keyi+1 , end]
}
 

🎏小区间优化

📌小区间优化的原理

快排的递归展开思路类似于二叉树,因此它们拥有同样的弊病,就是越靠近树的底部,空递归的情况就越多,并且空递归的规模量非常大,拿下面这颗树来举例:

我们递归遍历该树,发现空递归(紫色)访问次数竟然和总有效访问次数(绿色)是相同.而对于快排来说,这样的空递归不仅浪费时间,而且是没有任何实际意义的.

因此我们可以考虑采用一种办法,将快排的递归范围加以限制,比如当我们不断分割快排子区间,当子区间数组元素小于10个数时,我们就不再进行快排递归排序,而使用直接插入排序来对该小区间进行排序,这样就可以有效的消灭超过一半的递归,从而提升快排的效率.


📌小区间优化的代码实现

清楚了上面的原理之后,我们实现小区间优化的思路为:

  1. 判断小区间数组是否小于10个数.
  2. 如果区间不小于10,则执行快排逻辑.
  3. 如果区间小于等于10,则执行直接插入排序逻辑.

综上所述,小区间代码实现如下:

//交换函数
void Swap(int* a, int* b)
{
  int tmp = *a;
  *a = *b;
  *b = tmp;
}
 
//三数取中法取key函数
void SwapMid_key(int* a, int left, int right)
{
  int midi = (left + right) / 2;
  if (a[left] < a[midi])
  {
    if (a[midi] < a[right])
    {
      midi = midi;
    }
    else if (a[left] > a[right])
    {
      midi = left;
    }
    else 
    {
      midi = right;
    }
  }
  else // a[left] > a[mid]
  {
    if (a[midi] > a[right])
    {
      midi = midi;
    }
    else if (a[left] < a[right])
    {
      midi = left;
    }
    else
    {
      midi = right;
    }
  }
  if (midi != left)
    Swap(&a[midi], &a[left]);
}
 
//直接插入排序函数
void InsertSort(int* a, int n)
{
  for (int i = 1; i < n; i++)
  {
    int end = i - 1;
    int tmp = a[i];
    //将tmp插入到[0,end]这个区间里
    while (end >= 0)
    {
      if (tmp < a[end])
      {
        a[end + 1] = a[end];
        end--;
      }
      else
      {
        break;
      }
    }
    a[end + 1] = tmp;
  }
}
 
//小区间优化版快排
void QuickSort(int* a, int left, int right)
{
  if (left >= right)
    return;
  if ((right - left + 1 ) > 10)
  {
    int keyi = left;
    SwapMid_key(a, left, right);
 
    //双指针前后移动法快排
    int prev = left;
    int cur = left + 1;
    while (cur <= right)
    {
      if (a[cur] < a[keyi] && ++prev != cur)
        Swap(&a[cur], &a[prev]);
 
      ++cur;
    }
    Swap(&a[prev], &a[keyi]);
    keyi = prev;
 
    QuickSort(a, left, keyi - 1);
    QuickSort(a, keyi + 1, right);
  }
  else
  {
    InsertSort( a + left , right - left + 1 );
  }
}

五.借助栈实现非递归快速排序

📌为什么要将递归的快速排序算法改为非递归?

递归函数有以下几个缺点:

  • 内存消耗大:递归调用会占用大量的内存空间,因为每次调用都需要在内存中保存当前的状态和参数。
  • 性能低下:递归调用会增加函数调用的开销,因此在一些情况下会导致程序的性能下降。
  • 可读性差:递归函数通常比较复杂,难以理解和调试,降低了代码的可读性。
  • 可能导致栈溢出:如果递归调用层次过深,会导致栈溢出的问题,使程序崩溃
  • 难以优化:一些编译器和优化工具难以对递归函数进行有效的优化,导致性能不佳。

📌递归函数改非递归的思路

  1. 直接改为循环.(如:斐波那契数列)
  2. 利用栈辅助改为循环.(如:二叉树的前序遍历)

📌快速排序改非递归的思路

  1. 将初始数组区间压入栈
  2. 在栈里取一段区间,单趟排序
  3. 单趟分割子区间入栈
  4. 子区间只有一个值或着不存在就不入栈
  5. 重复步骤2-4,直到栈为空,则排序完成.

📌快速排序改非递归的代码实现

因为快排改非递归时要借助栈结构,因此我先将栈相关定义的头文件贴在这里,具体栈的C语言完整实现可以移步我的另一篇博客,在文末有数据结构栈实现的完整代码,大家可以直接粘贴过来使用:

http://t.csdnimg.cn/FL0V3

(注:如果本身没有自己实现数据结构栈的工程文件的,一定要将该博客末尾的Stack.h文件和Stack.c文件粘贴在排序项目文件里才可以正常使用栈的相关功能,否则C语言是不支持直接使用的!)

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
#include<stdlib.h>
#include<stdbool.h>
#include<assert.h>
 
typedef int STDataType;
 
typedef struct Stack
{
  STDataType*arr;
  int top;
  int capacity;
}ST;
 
void STInit(ST* ps);
void STDestroy(ST* ps);
void STPush(ST* ps, STDataType x);
void STPop(ST* ps);
int STSize(ST* ps);
bool STEmpty(ST* ps);
STDataType STTop(ST* ps);
void STMenu();

综上,快排的非递归代码实现如下:

//交换函数
void Swap(int* a, int* b)
{
  int tmp = *a;
  *a = *b;
  *b = tmp;
}
 
//三数取中法取key函数
void SwapMid_key(int* a, int left, int right)
{
  int midi = (left + right) / 2;
  if (a[left] < a[midi])
  {
    if (a[midi] < a[right])
    {
      midi = midi;
    }
    else if (a[left] > a[right])
    {
      midi = left;
    }
    else 
    {
      midi = right;
    }
  }
  else // a[left] > a[mid]
  {
    if (a[midi] > a[right])
    {
      midi = midi;
    }
    else if (a[left] < a[right])
    {
      midi = left;
    }
    else
    {
      midi = right;
    }
  }
  if (midi != left)
    Swap(&a[midi], &a[left]);
}
 
//快速排序主函数(非递归版
void QuickSortNonR(int* a, int left, int right)
{
  ST st;
  STInit(&st);
 
  STPush(&st, right);//先入后出
  STPush(&st, left);
 
  while (!STEmpty(&st))
  {
    int begin = STTop(&st);
    STPop(&st);
    int end = STTop(&st);
    STPop(&st);
 
    int keyi = begin;
    SwapMid_key(a, begin, end);
 
    //双指针前后移动法快排
    int prev = begin;
    int cur = begin + 1;
 
    while (cur <= end)
    {
      if (a[cur] < a[keyi] && ++prev != cur)
        Swap(&a[cur], &a[prev]);
      ++cur;
    }
 
    Swap(&a[prev], &a[keyi]);
    keyi = prev;
 
    if (keyi + 1 < end)
    {
      STPush(&st, end);
      STPush(&st, keyi + 1);
    }
 
    if (begin < keyi - 1)
    {
      STPush(&st, keyi - 1);
      STPush(&st, begin);
    }
  }
 
  STDestroy(&st);
}

六.快速排序的三路划分

//主要解决快速排序面对大量重复数据时效率低下的问题

//该部分内容待补


结语

希望这篇快速排序算法详解能对大家有所帮助,欢迎大佬们留言或私信与我交流.

有关更多排序相关知识可以移步:

https://blog.csdn.net/weixin_72357342/article/details/135038495?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22135038495%22%2C%22source%22%3A%22weixin_72357342%22%7D&fromshare=blogdetail

学海漫浩浩,我亦苦作舟!关注我,大家一起学习,一起进步!


数据结构排序篇思维导图:



相关文章
|
21天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
33 1
|
25天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
76 4
|
1月前
|
搜索推荐 C语言
【排序算法】快速排序升级版--三路快排详解 + 实现(c语言)
本文介绍了快速排序的升级版——三路快排。传统快速排序在处理大量相同元素时效率较低,而三路快排通过将数组分为三部分(小于、等于、大于基准值)来优化这一问题。文章详细讲解了三路快排的实现步骤,并提供了完整的代码示例。
57 4
|
22天前
|
存储 搜索推荐 Python
用 Python 实现快速排序算法。
快速排序的平均时间复杂度为$O(nlogn)$,空间复杂度为$O(logn)$。它在大多数情况下表现良好,但在某些特殊情况下可能会退化为最坏情况,时间复杂度为$O(n^2)$。你可以根据实际需求对代码进行调整和修改,或者尝试使用其他优化策略来提高快速排序的性能
115 61
|
22天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
22天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
1月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
96 23
|
1月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
59 20
|
21天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
50 1
|
1月前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
49 0
下一篇
DataWorks