一、排序的概念
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次 序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排 序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
排序在实际生活中随处可见:比如大学的排名,某宝上商品销量,好评率的排序等等。
* 常见排序算法
那么我们先来看看插入排序。
二、直接插入排序
1、插入排序是一种简单的插入排序法,其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列。实际中我们玩扑克牌时,就用了插入排序的思想。
2、直接插入排序
* 当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移。
* 代码实现一:
void swap(int* a, int* b) { int tmp = *a; *a = *b; *b = tmp; } //[0, end]有序,将下标为 end+1的数插入,使[0, end+1]的数有序 void InsertSort(int* a, int n) { for(int i = 0; i < n-1; i++) { int end = i; while(end >= 0) { if(a[end] > a[end+1]) { swap(&a[end], &a[end+1]); end--; } else { break; } } } }
* 代码实现二:[0, end]有序,将下标为 end+1的数插入,使[0, end+1]的数有序
void InsertSort(int* a, int n) { for(int i = 0; i < n-1; i++) { int end = i; int tmp = a[end + 1]; while(end >= 0) { if(a[end] > tmp) { a[end + 1] = a[end]; end--; } else { break; } } a[end+1] = tmp; } }
直接插入排序的特性总结:
1、元素集合越接近有序,直接插入排序算法的时间效率越高
2、时间复杂度:O(N^2) 待排序表最坏的情况就是逆序的情况。此时我们共需要比较 1+2+3+4+......+(n-1) = n*(n-1) / 2。
3、空间复杂度:O(1)
4.、稳定性:稳定
那么,有没有比直接插入排序算法效率更高的算法呢?
对于我们普通人来说可能一辈子都想不到,但是有一位叫做Donald Shell的大佬在1959年的时候就
提出了一个非常巧妙且影响深远的算法,就是我们现在叫的希尔排序。
那么接下来就让我们来感受一下大佬的智慧。
三、希尔排序
一、希尔排序法又称缩小增量法。希尔排序法的基本思想是: 先选定一个整数,把待排序文件中所有记录分成组,所有距离为n的记录分在同一组内,并对每一组内的记录进行排序。然后,使n减小,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。
希尔排序是基于插入排序的以下两点性质而提出改进方法的:
1、插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率。
2、但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位。
如下图:
二、代码实现
void ShellSort(int* a, int n) { int gap = n; while(gap >= 1) { gap = gap / 2; for(int i = 0; i < n - gap; i++) { int end = i; int tmp = a[end + gap]; while(end >= 0) { if(a[end] > tmp) { a[end + gap] = a[end]; end -= gap; } else { break; } } a[end + gap] = tmp; } }
三、希尔排序的特性总结:
1. 希尔排序是对直接插入排序的优化。
2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。
3、稳定性:不稳定 。
4、 希尔排序的时间复杂度:希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,我们就暂时认为是: N*log N 注:log是以2为底