【C语言 - 数据结构】万字详解快速排序、归并排序(下)

简介: 【C语言 - 数据结构】万字详解快速排序、归并排序

4.2快排的优化二:小区间优化


为什么要用小区间优化,最重要的原因就是递归的程度越深,其被分成的数目越多,子问题越多,在此时我们可以利用插入排序进行优化。


1669442238750.jpg


代码示例:

void QuickSort4(int* a, int begin, int end)
{
  //子区间相等只有一个值或者不存在那么就是递归结束的子问题
  if (begin >= end)
  return;
  //小区间直接插入排序控制有序
  if (end - begin + 1 <= 10)
  {
  InsertSort(a + begin, end - begin + 1);//插入好多个区间
  }
  else
  {
  int keyi = PartSort3(a, begin, end);
  // [begin, keyi - 1]keyi[keyi + 1, end]
  QuickSort(a, begin, keyi - 1);
  QuickSort(a, keyi + 1, end);
  }
}


五、归并排序的概念


5.1归并排序的基本思想:


基本思想: 归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:


5.2归并排序的动态图:


2.gif


5.3归并排序的图解:


1669442285795.jpg

1669442294488.jpg

简而言之就是


小的放在新数组里


先分再归


六、归并排序的递归实现


6.1按照如下归并排序的基本思路实现代码


1669442312276.jpg


这是按照[begin, mid] 和[mid + 1, end]区间来划分的


如果是按照[begin, mid - 1]和[mid , end]这样分会分的不均匀,出现[1, 2]的中位数也是1,造成死循环,只要是数是奇数都会出现这种情况。


6.2写一段代码看归并排序的思路:


void _MergeSort(int* a, int begin, int end, int* tmp)
{
  if (begin >= end)
  {
  return;
  }
  int mid = (begin + end) / 2;
  //[begin, mid - 1], [mid, end]
  _MergeSort(a, begin, mid, tmp);
  _MergeSort(a, mid + 1, end, tmp);
  printf("归并[%d, %d][%d, %d]\n", begin, mid, mid + 1, end);
}

归并排序的具体过程

1669442344010.jpg

归并排序的递归搜索树图


1669442352247.jpg


归并排序的递归函数代码如下:

//借助子函数
void _MergeSort(int* a, int begin, int end, int* tmp)
{
  if (begin >= end)
  {
  return;
  }
  int mid = (begin + end) / 2;
  //[begin, mid - 1], [mid, end]
  _MergeSort(a, begin, mid, tmp);
  _MergeSort(a, mid + 1, end, tmp);
  //printf("归并[%d, %d][%d, %d]\n", begin, mid, mid + 1, end);
  int begin1 = begin, end1 = mid;
  int begin2 = mid + 1, end2 = end;
  int index = begin;//相当于是每一个区间的开始都是begin
  while (begin1 <= end1 && begin2 <= end2)
  {
  if (a[begin1] < a[begin2])
    tmp[index++] = a[begin1++];
  else
    tmp[index++] = a[begin2++];
  }
  //如果还有谁没结束,就把谁放tmp的后面
  while (begin1 <= end1)
  tmp[index++] = a[begin1++];
  while (begin2 <= end2)
  tmp[index++] = a[begin2++];
  //把tmp里的数拷贝回a数组
  //y总是用for循环实现的
  memcpy(a+begin, tmp+begin, (end - begin + 1) * sizeof(int));
}
void MergeSort(int* a, int n)
{
    int* tmp = (int*)malloc(sizeof(int) * n);
    assert(tmp);
    _MergeSort(a, 0, n - 1, tmp);
    free(tmp);
};


七、归并排序的非递归实现以及归并排序的模板


7.1归并排序递归改非递归的思路:


思路:用循环,人为设置一个gap间隙


刚开始gap = 1,后面gap呈2倍增长


直到gap = 数组长度时结束


gap的作用就相当于划分区间了,每次划分完就排序每个区间,排完就拷贝回原数组


1669442376030.jpg


递归改非递归思路虽然简单但是区间的边界控制还是很伤脑筋的,和gap有关的区间边界都要控制,原因:gap突变太快了,跟gap有关的全部都存在越界访问的风险,这一点算是递归改非递归的难点,这点需要我们取突破。个人觉得这个有点像希尔排序对插入排序的优化,使用了gap间隙,使效率得到大大的提升,但是两者还是有细微区别的。


7.2归并排序递归改非递归的代码实现:


void MergeSortNonR(int* a, int n)
{
    int* tmp = (int*)malloc(sizeof(int) * n);
    int gap = 1;
    while(gap < n)
    { 
        //间距为gap是一组,两两归并
        for (int i = 0; i < n; i+= gap*2)
        {
            int begin1 = i, end1 = i + gap -1 ;
            int begin2 = i + gap, end2 = i + 2*gap - 1;
            //end1越界,修正
            if (end1 >= n)
                end1 = n - 1;
            //begin2越界,第二个区间不存在,修正成不存在的区间
            if (begin2 >= n)
            {
                begin2 = n;
                end2 = n - 1;
            }
            //begin2 ok, end2越界,修正2即可
            if (begin2 < n && end2 >= n)
                end2 = n - 1;
            //  条件断点
            if (begin1 == 8 && end1 == 9
                && begin2 == 9 && end2 == 9)
            {
                int x = 0;
            }
            int index = i;
            while (begin1 <= end1 && begin2 <= end2)
            {
                if (a[begin1] < a[begin2])
                    tmp[index++] = a[begin1++];
                else
                    tmp[index++] = a[begin2++];
            }
            //如果还有谁没结束,就把谁放tmp的后面
            while (begin1 <= end1)
                tmp[index++] = a[begin1++];
            while (begin2 <= end2)
                tmp[index++] = a[begin2++];
        }
        memcpy(a, tmp, n * sizeof(int));
        gap *= 2;
    }
    free(tmp);
}


7.3介绍一种比较好找bug 的调试方法:条件断点法


作用:调试时可以直接使程序停在想要的位置,从而提升调试效率


1669442403989.jpg


比如说我们想让程序停在出问题的归并[8, 9][9, 9]这个区域,我们只需写一段代码,然后将断点打在这个位置:

if (begin1 == 8 && end1 == 9
                && begin2 == 9 && end2 == 9)
            {
                int x = 0;
            }


7.4归并排序的模板(竞赛用)


#include<iostream>
using namespace std;
const int N = 100010;
int n;
int q[N], tmp[N];
void merge_sort(int q[], int l, int r)
{
    if(l >= r) return;// 特判区间内如果只有一个数或者为空时,直接return;
    int mid = l + r >> 1;//确定分界点mid
    merge_sort(q, l, mid), merge_sort(q, mid+1, r);//递归排序两边
    int k = 0, i = l, j = mid + 1;
    while(i <= mid && j <= r)//归并,合并两边
        if(q[i] <= q[j]) tmp[k++] = q[i++];
        else tmp[k++] = q[j++];
        while(i <= mid) tmp[k++] = q[i++];//再次查看左边区间是否还有剩余
        while(j <= r) tmp[k++] = q[j++];//再次查看右边区间是否还有剩余
        for (i = l, j = 0; i <= r; i++, j++) q[i] = tmp[j];//把tmp[i] 存到q[j]里
}
int main ()
{
    scanf("%d", &n);
    for(int i = 0; i < n; i++) scanf("%d", &q[i]);
    merge_sort(q, 0, n - 1);
    for(int i = 0; i < n; i++) printf("%d ", q[i]);
    return 0;
}


八、两种排序的对比总结


8.1快速排序的特性总结


快速排序的特性总结: 1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序


2. 时间复杂度:O(N*logN)


3. 空间复杂度:O(logN)


4. 稳定性:不稳定


8.2归并排序的特性总结


归并排序的特性总结: 1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。


2. 时间复杂度:O(N*logN)


3. 空间复杂度:O(N)


4. 稳定性:稳定


8.3快速排序的时间、空间复杂度分析(来自书籍)


快速排序的一次划分Parttion算法两头交替搜索,直到两段区间重合,时间复杂度是O(N),整个快速排序的时间复杂度与划分的趟数有关,也就是说,快速排序的时间性能取决于快速排序递归的深度,如果是划分过程比较均匀, 递归树是平衡的,此时性能较好。在最优的情况下,划分Parttion每次都比较均匀,如果排序n个关键字,递归的搜索深度为log(n),这样整个算法的时间复杂度是O(nlogn)的。


如果是在有序的情况下,长度为n的数据表要经过N次划分,此时的时间复杂度为o(N^2),如果是用三数取中,可以降低其时间复杂度。


快排的空间复杂度分析:从空间性能上看,尽管快速排序需要一个元素的辅助空间,由于快速排序是递归的,每层递归调用时的指针和参数均要栈来存放,存储开销在理想的情况下为O(logN);在最坏的情况下为O(N)。


另外,快速排序过程中的关键词相同的元素在排序前后相对位置发生了改变,因此,快速排序是不稳定的排序算法。


8.4归并排序的时间、空间复杂度分析


归并排序是分治思想的最典型的例子,上面的算法中,对一组数a[n]进行排序,先将它分为[begin, mid] 和[mid + 1, end]区间来划分的,分别通过递归调用将他们单独排序,最终将有序的子数组归并为最终的排序结果。具有N个记录的序列进行归并排序的递归的深度就是具有n个结点的完全二叉树的深度,可以看出来整个排序归并排序需要进行log(N)次,因此,总的归并排序算法的时间复杂度为O(logN),而且这是归并排序算法最好、最坏、平均的时间复杂度。


由于归并排序在归并过程中需要与原始记录序列同样数量的存储空间存放归并结果以及递归时深度为logn的栈空间,因此,空间复杂度为O(n + logn)。


非递归的合并排序避免了递归时深度为logn 的栈空间,空间只是用到了申请归并临时用的tmp数组,因此,时间复杂度为O(n),在时间上也有一定的提升,省去了递归拆分,但总体时间复杂度还是O(logn)。应该说,使用归并排序时,尽量考虑非递归的方法。


8.5快速排序和归并排序测试用时


数据量为10万时,不分伯仲(release版本)


1669442465024.jpg


数据量为100万时(release版本)


1669442480810.jpg


数据量为1000万时(release版本)


1669442490023.jpg

相关文章
|
2天前
【初阶数据结构】打破递归束缚:掌握非递归版快速排序与归并排序
【初阶数据结构】打破递归束缚:掌握非递归版快速排序与归并排序
|
29天前
|
存储 人工智能 C语言
数据结构基础详解(C语言): 栈的括号匹配(实战)与栈的表达式求值&&特殊矩阵的压缩存储
本文首先介绍了栈的应用之一——括号匹配,利用栈的特性实现左右括号的匹配检测。接着详细描述了南京理工大学的一道编程题,要求判断输入字符串中的括号是否正确匹配,并给出了完整的代码示例。此外,还探讨了栈在表达式求值中的应用,包括中缀、后缀和前缀表达式的转换与计算方法。最后,文章介绍了矩阵的压缩存储技术,涵盖对称矩阵、三角矩阵及稀疏矩阵的不同压缩存储策略,提高存储效率。
|
29天前
|
C语言
数据结构基础详解(C语言):图的基本概念_无向图_有向图_子图_生成树_生成森林_完全图
本文介绍了图的基本概念,包括图的定义、无向图与有向图、简单图与多重图等,并解释了顶点度、路径、连通性等相关术语。此外还讨论了子图、生成树、带权图及几种特殊形态的图,如完全图和树等。通过这些概念,读者可以更好地理解图论的基础知识。
|
3天前
|
搜索推荐 C语言 C++
【C语言】指针篇-精通库中的快速排序算法:巧妙掌握技巧(4/5)
【C语言】指针篇-精通库中的快速排序算法:巧妙掌握技巧(4/5)
|
1月前
|
存储 C语言
数据结构基础详解(C语言): 树与二叉树的应用_哈夫曼树与哈夫曼曼编码_并查集_二叉排序树_平衡二叉树
本文详细介绍了树与二叉树的应用,涵盖哈夫曼树与哈夫曼编码、并查集以及二叉排序树等内容。首先讲解了哈夫曼树的构造方法及其在数据压缩中的应用;接着介绍了并查集的基本概念、存储结构及优化方法;随后探讨了二叉排序树的定义、查找、插入和删除操作;最后阐述了平衡二叉树的概念及其在保证树平衡状态下的插入和删除操作。通过本文,读者可以全面了解树与二叉树在实际问题中的应用技巧和优化策略。
|
1月前
|
存储 算法 C语言
C语言手撕数据结构代码_顺序表_静态存储_动态存储
本文介绍了基于静态和动态存储的顺序表操作实现,涵盖创建、删除、插入、合并、求交集与差集、逆置及循环移动等常见操作。通过详细的C语言代码示例,展示了如何高效地处理顺序表数据结构的各种问题。
|
2天前
|
算法 搜索推荐 C语言
【C语言篇】深入理解指针4(模拟实现qsort函数)
【C语言篇】深入理解指针4(模拟实现qsort函数)
11 2
|
2天前
|
C语言
【C语言】探索文件读写函数的全貌(三)
【C语言】探索文件读写函数的全貌