1.排序的概念
说到排序,我们开始之前先来了解了解排序的一些相关的概念:
排序:所谓排序,就是将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列。
排序还可以分为内部排序和外部排序:
- 内部排序:数据元素全部放在内存中的排序。
- 外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序
这里我们还需要理解一个概念
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次
序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排
序算法是稳定的;否则称为不稳定的。
排序在实际生活中随处可见:比如大学的排名,企业排名,商品价格的排序等等。(以下是网上找的图片)
2.常见的排序算法及实现
2.1插入排序
2.1.1基本思想
直接插入排序是一种简单的插入排序法,其基本思想是:待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。 插入排序的代码实现虽然没有冒泡排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂
2.1.2直接插入排序
当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移
2.1.3代码实现
void Print(int* a, int n) { for (int i = 0; i < n; i++) { printf("%d ", a[i]); } printf("\n"); } void InsertSort(int* a, int n) { for (int i = 0; i < n - 1; i++) { int end = i; int tmp = a[end + 1]; while (end >= 0) { if (a[end] > tmp) { a[end + 1] = a[end]; --end; } else { break; } } a[end + 1] = tmp; } } void TestInsertSort() { int a[] = { 5,8,2,50,7,-1,100,66 }; int n = sizeof(a) / sizeof(a[0]); InsertSort(a, n); Print(a, n); } int main() { TestInsertSort(); }
直接插入排序的特性总结:
- 元素集合越接近有序,直接插入排序算法的时间效率越高
- 时间复杂度:O(N^2)
- 空间复杂度:O(1),它是一种稳定的排序算法
- 稳定性:稳定
2.1.4希尔排序
2.2.1基本思想
希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成整数个组,所有距离为相同的记录分在同一组内,并对每一组内的记录进行排序。然后,重复上述分组和排序的工作。当到达=1时所有记录在统一组内排好序
2.2.2代码实现
void Print(int* a, int n) { for (int i = 0; i < n; i++) { printf("%d ", a[i]); } printf("\n"); } void ShellSort(int* a, int n) { int gap=n; while (gap > 1) { gap = gap / 3 + 1; for (int i = 0; i < n - gap; i++) { int end = i; int tmp = a[end + gap]; while (end >= 0) { if (a[end] > tmp) { a[end + gap] = a[end]; end -= gap; } else { break; } } a[end + gap] = tmp; } } } void TestShellSort() { int a[] = { 5,8,2,50,7,-1,100,66 }; int n = sizeof(a) / sizeof(a[0]); ShellSort(a, n); Print(a, n); } int main() { TestShellSort(); }
希尔排序的特性总结:
- 希尔排序是对直接插入排序的优化。
- 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就
会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。 - 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定 (希尔排序的时间复杂度为O(N*logN))
《数据结构-用面相对象方法与C++描述》— 殷人昆
因为gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,我们暂时就按照:到 来算。
- 稳定性:不稳定