1.归并排序
基本思想:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并排序核心步骤:
动图演示:
1.1 递归实现归并排序:
归并排序类似于二叉树中的后序遍历,先让整个数组分为两个子序列,归并这两部份子序列,但是归并需要两部份子序列有序,然后取小的尾插到一个新开辟的数组中,归并完成后后再拷贝回原数组,如何让子序列有序,还要再次将每个子序列分为两部分,直到每个子序列只有一个值,这时已经递归到最深处,然会递归向回归并。
递归代码实现:
//归并排序 //开辟好空间后由下面元素调用此函数 void _MergeSort(int* arr, int* tmp, int begin, int end) { if (begin == end) { return; } int midi = (begin + end) / 2; _MergeSort(arr, tmp, begin, midi); _MergeSort(arr, tmp, midi+1, end); int begin1 = begin; int end1 = midi; int begin2 = midi + 1; int end2 = end; int i = begin; //归并 取小的尾插到开辟的空间 while (begin1 <= end1 && begin2 <= end2) { if (arr[begin1] <= arr[begin2]) { tmp[i++] = arr[begin1++]; } else { tmp[i++] = arr[begin2++]; } } while (begin1 <= end1) { tmp[i++] = arr[begin1++]; } while (begin2 <= end2) { tmp[i++] = arr[begin2++]; } //将归并好的两组数据拷贝会原数组 memcpy(arr + begin, tmp + begin, sizeof(int) * (end - begin + 1)); } void MergeSort(int* arr, int n) { //开辟空间 int* tmp = (int*)malloc(sizeof(int) * n); _MergeSort(arr, tmp, 0, n - 1); }
小区间优化
//小区间优化 if (end - begin +1<10) { //使用插入排序 InsertSort(arr + begin, end - begin + 1); return; }
优化的本质是减小递归调用的次数,由于二叉树的性质。我们可以得出满二叉树后三层大约占总个数的85%。为了减小递归开销,我们可以将小区间的递归调用改为直接插入排序,可以提高一点排序的性能,但也不会提高很多。快排也可以使用这种方式优化。
1.2 非递归实现归并排序
我们可以先让每组gap=1个数据,每次归并两组,然后在让gap*=2,再次归并,直到gap>n。
代码实现:
//非递归实现归并排序 void MergeSortNonR1(int* arr, int n) { int* tmp = (int*)malloc(sizeof(int) * n); //每组有gap个数据,归并两组 int gap = 1; while (gap < n) { int j = 0; for (int i = 0; i < n; i += 2 * gap) { int begin1 = i, end1 = i + gap - 1; int begin2 = i + gap, end2 = i + 2 * gap - 1; if (end1 >= n || begin2 >= n)//不需要归并 { break; } //修正 if (end2 >= n) { end2 = n - 1; } //归并 while (begin1 <= end1 && begin2 <= end2) { if (arr[begin1] <= arr[begin2]) { tmp[j++] = arr[begin1++]; } else { tmp[j++] = arr[begin2++]; } } while (begin1 <= end1) { tmp[j++] = arr[begin1++]; } while (begin2 <= end2) { tmp[j++] = arr[begin2++]; } //将归并后的两组数据 拷贝回原数组 memcpy(arr + i, tmp + i, sizeof(int) * (end2 - i + 1)); } gap *= 2; } }
边界越界问题:
int begin1 = i, end1 = i + gap - 1; int begin2 = i + gap, end2 = i + 2 * gap - 1;
begin1不会越界,因为begin1 = i,i 复合循环条件 。
- end1,begin2,end2都越界
- begin2,end2越界
- end2越界
1. end1,begin2,end2都越界
此时不需要归并直接跳出循环。
2. begin2,end2越界
此时也不需要归并直接跳出循环。
3. end2越界
此时需要归并,但是我们要修改end2,将end2改为n-1。
代码:
if (end1 >= n || begin2 >= n)//不需要归并 { break; } //修正 if (end2 >= n) { end2 = n - 1; }
1.3 归并排序的特性总结:
- 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
- 时间复杂度:O(N*logN)
- 空间复杂度:O(N)
- 稳定性:稳定
1.4 外部排序
概念:当数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
在我们所学的排序算法中,只有非递归归并排序的思想可以用于外部排序。其他排序算法都只适用于内部排序,因为他们都使用了下标来进行随机存取,而非递归归并排序不需要,是顺序存取,这里举个例子:
假如我们由100亿个整数要排序,也就是大约40G,而我们的内存中只有1G,步骤:
- 把40G的文件分为40份。
- 让每份文件依次放到内部中排序,让40份文件内部有序。
- 两两归并,分别从两个文件中读一个数据,然后选小的写文件,这时就与非递归归并排序相同了。
2.计数排序
思想:计数排序又称为鸽巢原理,是一种非比较排序,是对哈希直接定址法的变形应用。
2.1 操作步骤:
- 统计相同元素出现次数
- 根据统计的结果将序列回收到原来的序列中
代码实现:
// 计数排序 void CountSort(int* arr, int n) { //遍历 确定最大值与最小值 int max = arr[0]; int min = arr[0]; for (int i = 0; i < n; i++) { if (arr[i] < min) { min = arr[i]; } if (arr[i] > max) { max = arr[i]; } } //遍历计数 int range = max - min + 1; int* CountA = (int*)malloc(sizeof(int) * range); memset(CountA, 0, sizeof(int) * range); for (int i = 0; i < n; i++) { CountA[arr[i] - min]++; } //回收到原数组 int j = 0; for (int i = 0; i < range; i++) { while (CountA[i]--) { arr[j++] = i + min; } } }
2.2 计数排序的特性总结:
- 计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
- 时间复杂度:O(MAX(N,范围))
- 空间复杂度:O(范围)
- 稳定性:稳定
3. 7种常见比较排序比较
排序方法 | 平均情况 | 最好情况 | 最坏情况 | 辅助空间 | 稳定性 |
冒泡排序 | O(N^2) | O(N) | O(N^2) | O(1) | 稳定 |
简单选择排序 | O(N^2) | O(N^2) | O(N^2) | O(1) | 不稳定 |
直接插入排序 | O(N^2) | O(N) | O(N^2) | O(1) | 稳定 |
希尔排序 | O(NlogN)~O(N^2) | O(N^1.3) | O(N^2) | O(1) | 不稳定 |
堆排序 | O(NlogN) | O(NlogN) | O(N*logN) | O(1) | 不稳定 |
归并排序 | O(NlogN) | O(NlogN) | O(N*logN) | O(n) | 稳定 |
快速排序 | O(NlogN) | O(NlogN) | O(N^2) | O(logn)~O(n) | 不稳定 |
本篇结束!