数据结构和算法 (一)常见的几种排序算法-插入、选择、冒泡、快排、堆排等

简介:

Java面试宝典系列之基础排序算法

本文就是介绍一些常见的排序算法。排序是一个非常常见的应用场景,很多时候,我们需要根据自己需要排序的数据类型,来自定义排序算法,但是,在这里,我们只介绍这些基础排序算法,包括:插入排序、选择排序、冒泡排序、快速排序(重点)、堆排序、归并排序等等。看下图:

给定数组:int data[] = {9,2,7,19,100,97,63,208,55,78}

一、直接插入排序(内部排序、O(n2)、稳定)

原理:从待排序的数中选出一个来,插入到前面的合适位置。

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class InsertSort {  
  4.   
  5.     static int data[] = { 9, 2, 7, 19, 100, 97, 63, 208, 55, 78 };  
  6.   
  7.   
  8.       
     
       
    复制代码
     public static void insertSort() {  
    for (int i = 1; i < unsorted.Length; i++) { if (unsorted[i - 1] > unsorted[i]) { int temp = unsorted[i]; int j = i; while (j > 0 && unsorted[j - 1] > temp) { unsorted[j] = unsorted[j - 1]; j--; } unsorted[j] = temp; } }
    }


     public static void insertSort() {  
    for (int i = 1; i < data.length; i++) {
    if (data[i] >= data[i - 1]) {
    continue;
    }
    int temp = data[i];
    for (int j = i - 1; j >= 0; j--) {
    if (temp < data[j]) {
    data[j + 1] = data[j];
    if(j==0){
    data[j ] = temp;
    }

    } else {
    data[j + 1] = temp;
    break;
    }
    }
    }
     

    }
     
        
    复制代码
     

     

  9.    
  10.     public static void main(String[] args) {  
  11.         print();  
  12.         System.out.println();  
  13.         insertSort();  
  14.         System.out.println();  
  15.         print();  
  16.     }  
  17.   
  18.     static void print() {  
  19.         for (int i = 0; i < data.length; i++) {  
  20.             System.out.print(data[i] + " ");  
  21.         }  
  22.     }  
  23.   
  24. }  

我简单的讲解一下过程:思路上从待排序的数据中选出一个,插入到前面合适的位置,耗时点在插入方面,合适的位置意味着我们需要进行比较找出哪是合适的位置,举个例子:对于9,2,7,19,100,97,63,208,55,78 这组数,第一个数9前面没有,不做操作,当第一个数完后,剩下的数就是待排序的数,我们将要从除去9开始的书中选出一个插入到前面合适的位置,拿到2后, 放在tmp上,进行注释中的2处的代码,2处的代码就是通过循环找出这个合适的位置,发现比tmp大的数,立即将该数向后移动一位(这样做的目的是:前面 需要空出一位来进行插入),最后通过注释3处的代码将数插入。

本排序适合:基本有序的数据

二、选择排序(O(n2)、不稳定)
与直接插入排序正好相反,选择排序是从待排序的数中选出最小的放在已经排好的后面,这个算法选数耗时。

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class SelectSort {  
  4.   
  5.     static int data[] = { 9, 2, 7, 19, 100, 97, 63, 208, 55, 78 };  
  6.   
  7.     public static void selectSort() {  
  8.         int i, j, k, tmp = 0;  
  9.         for (i = 0; i < data.length - 1; i++) {  
  10.             k = i;  
  11.             for (j = i + 1; j < data.length; j++)  
  12.                 if (data[j] < data[k])  
  13.                     k = j;  
  14.             if (k != i) {  
  15.                 tmp = data[i];  
  16.                 data[i] = data[k];  
  17.                 data[k] = tmp;  
  18.             }  
  19.         }  
  20.     }  
  21.     public static void main(String[] args) {  
  22.         print();  
  23.         System.out.println();  
  24.         selectSort();  
  25.         System.out.println();  
  26.         print();  
  27.     }  
  28.   
  29.     static void print() {  
  30.         for (int i = 0; i < data.length; i++) {  
  31.             System.out.print(data[i] + " ");  
  32.         }  
  33.     }  
  34.   
  35. }  

通过循环,找出最小的数的下标,赋值于k,即k永远保持待排序数据中最小的数的下标,最后和当前位置i互换数据即可。

三、快速排序(O(nlogn)、不稳定)

快速排序简称快排,是一种比较快的排序,适合基本无序的数据,为什么这么说呢?下面我说下快排的思路:

设置两个指针:i和j,分别指向第一个和最后一个,i像后移动,j向前移动,选第一个数为标准(一般这样做,当然快排的关键就是这个“标准”的选取),从后面开始,找到第一个比标准小的数,互换位置,然后再从前面,找到第一个比标准大的数,互换位置,第一趟的结果就是标准左边的都小于标准,右边的都大于标准(但不一定有序),分成两拨后,继续递归的使用上述方法,最终有序!代码如下:

 

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class QuickSortTest {  
  4.   
  5.     static class QuickSort {  
  6.   
  7.         public int data[];  
  8.   
  9.         private int partition(int array[], int low, int high) {  
  10.             int key = array[low];  
  11.             while (low < high) {  
  12.                 while (low < high && array[high] >= key)  
  13.                     high--;  
  14.                 array[low] = array[high];  
  15.                 while (low < high && array[low] <= key)  
  16.                     low++;  
  17.                 array[high] = array[low];  
  18.             }  
  19.             array[low] = key;  
  20.             return low;  
  21.         }  
  22.   
  23.         public int[] sort(int low, int high) {  
  24.             if (low < high) {  
  25.                 int result = partition(data, low, high);  
  26.                 sort(low, result - 1);  
  27.                 sort(result + 1, high);  
  28.             }  
  29.             return data;  
  30.         }  
  31.     }  
  32.   
  33.     static void print(int data[]) {  
  34.         for (int i = 0; i < data.length; i++) {  
  35.             System.out.print(data[i] + " ");  
  36.         }  
  37.     }  
  38.   
  39.     public static void main(String[] args) {  
  40.         int data[] = { 20, 3, 10, 9, 186, 99, 200, 96, 3000 };  
  41.         print(data);  
  42.         System.out.println();  
  43.         QuickSort qs = new QuickSort();  
  44.         qs.data = data;  
  45.         qs.sort(0, data.length - 1);  
  46.         print(data);  
  47.     }  
  48. }  


看看上面的图,基本就明白了。

 

四、冒泡排序(稳定、基本有序可达O(n),最坏情况为O(n2))

冒泡排序是一种很简单,不论是理解还是时间起来都比较容易的一种排序算法,思路简单:小的数一点一点向前起泡,最终有序。

 

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class BubbleSort {  
  4.   
  5.     static int data[] = { 9, 2, 7, 19, 100, 97, 63, 208, 55, 78 };  
  6.   
  7.     public static void bubbleSort() {  
  8.         int i, j, tmp = 0;  
  9.         for (i = 0; i < data.length - 1; i++) {  
  10.             for (j = data.length - 1; j > i; j--) {  
  11.                 if (data[j] < data[j - 1]) {  
  12.                     tmp = data[j];  
  13.                     data[j] = data[j - 1];  
  14.                     data[j - 1] = tmp;  
  15.                 }  
  16.             }  
  17.         }  
  18.     }  
  19.   
  20.     public static void main(String[] args) {  
  21.         print();  
  22.         System.out.println();  
  23.         bubbleSort();  
  24.         System.out.println();  
  25.         print();  
  26.     }  
  27.   
  28.     static void print() {  
  29.         for (int i = 0; i < data.length; i++) {  
  30.             System.out.print(data[i] + " ");  
  31.         }  
  32.     }  
  33.   
  34. }  

 

五、堆排序

我们这里不详细介绍概念,堆的话,大家只要记得堆是一个完全二叉树(什么是完全二叉树,请不懂的读者去查资料),堆排序分为两种堆,大顶堆和小顶堆,大顶堆的意思就是堆顶元素是整个堆中最大的,小顶堆的意思就是堆顶元素是整个堆中最小的,满足:任何一非叶节点的关键字不大于或者不小于其左右孩子节点的关键字。堆排序是一个相对难理解的过程,下面我会较为清楚、详细的讲解一下堆排序。堆排序分为三个过程:

建堆:从一个数组顺序读取元素,建立一个堆(完全二叉树)

初始化:将堆进行调整,使得堆顶为最大(最大堆)或者最小(最小堆)的元素

维护:将堆顶元素出堆后,需要将堆的最后一个节点补充到堆顶,因为这样破坏了堆的秩序,所以需要进行维护。下面我们图示一下:

一般情况,建堆和初始化同步进行,

最后为如下所示,即为建堆、初始化成功。

我们可以观察下这个最大堆,看出堆顶是整个堆中最大的元素,而且除叶子节点外每个节点都大于其子节点。下面的过程就是当我们输出堆顶元素后,对堆进行维护。

过程是这样:将堆顶元素出堆后,用最后一个元素补充堆顶元素,这样破坏了之前的秩序,需要重新维护堆,在堆顶元素的左右节点中选出较小的和堆顶互换,然后一直递归下去,所以每次出一个元素,需要一次维护,堆排序适合解决topK问题,能将复杂度降到nlogK。下面是代码:

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class HeapSort {  
  4.     private static int[] sort = new int[] { 1, 0, 10, 20, 3, 5, 6, 4, 9, 8, 12,  
  5.             17, 34, 11 };  
  6.   
  7.     public static void main(String[] args) {  
  8.         buildMaxHeapify(sort);  
  9.         heapSort(sort);  
  10.         print(sort);  
  11.     }  
  12.   
  13.     private static void buildMaxHeapify(int[] data) {  
  14.         // 没有子节点的才需要创建最大堆,从最后一个的父节点开始  
  15.         int startIndex = getParentIndex(data.length - 1);  
  16.         // 从尾端开始创建最大堆,每次都是正确的堆  
  17.         for (int i = startIndex; i >= 0; i--) {  
  18.             maxHeapify(data, data.length, i);  
  19.         }  
  20.     }  
  21.   
  22.     /** 
  23.      * 创建最大堆 
  24.      *  
  25.      * @param data 
  26.      * @param heapSize 
  27.      *            需要创建最大堆的大小,一般在sort的时候用到,因为最多值放在末尾,末尾就不再归入最大堆了 
  28.      * @param index 
  29.      *            当前需要创建最大堆的位置 
  30.      */  
  31.     private static void maxHeapify(int[] data, int heapSize, int index) {  
  32.         // 当前点与左右子节点比较  
  33.         int left = getChildLeftIndex(index);  
  34.         int right = getChildRightIndex(index);  
  35.   
  36.         int largest = index;  
  37.         if (left < heapSize && data[index] < data[left]) {  
  38.             largest = left;  
  39.         }  
  40.         if (right < heapSize && data[largest] < data[right]) {  
  41.             largest = right;  
  42.         }  
  43.         // 得到最大值后可能需要交换,如果交换了,其子节点可能就不是最大堆了,需要重新调整  
  44.         if (largest != index) {  
  45.             int temp = data[index];  
  46.             data[index] = data[largest];  
  47.             data[largest] = temp;  
  48.             maxHeapify(data, heapSize, largest);  
  49.         }  
  50.     }  
  51.   
  52.     /** 
  53.      * 排序,最大值放在末尾,data虽然是最大堆,在排序后就成了递增的 
  54.      *  
  55.      * @param data 
  56.      */  
  57.     private static void heapSort(int[] data) {  
  58.         // 末尾与头交换,交换后调整最大堆  
  59.         for (int i = data.length - 1; i > 0; i--) {  
  60.             int temp = data[0];  
  61.             data[0] = data[i];  
  62.             data[i] = temp;  
  63.             maxHeapify(data, i, 0);  
  64.         }  
  65.     }  
  66.   
  67.     /** 
  68.      * 父节点位置 
  69.      *  
  70.      * @param current 
  71.      * @return 
  72.      */  
  73.     private static int getParentIndex(int current) {  
  74.         return (current - 1) >> 1;  
  75.     }  
  76.   
  77.     /** 
  78.      * 左子节点position 注意括号,加法优先级更高 
  79.      *  
  80.      * @param current 
  81.      * @return 
  82.      */  
  83.     private static int getChildLeftIndex(int current) {  
  84.         return (current << 1) + 1;  
  85.     }  
  86.   
  87.     /** 
  88.      * 右子节点position 
  89.      *  
  90.      * @param current 
  91.      * @return 
  92.      */  
  93.     private static int getChildRightIndex(int current) {  
  94.         return (current << 1) + 2;  
  95.     }  
  96.   
  97.     private static void print(int[] data) {  
  98.         int pre = -2;  
  99.         for (int i = 0; i < data.length; i++) {  
  100.             if (pre < (int) getLog(i + 1)) {  
  101.                 pre = (int) getLog(i + 1);  
  102.                 System.out.println();  
  103.             }  
  104.             System.out.print(data[i] + " |");  
  105.         }  
  106.     }  
  107.   
  108.     /** 
  109.      * 以2为底的对数 
  110.      *  
  111.      * @param param 
  112.      * @return 
  113.      */  
  114.     private static double getLog(double param) {  
  115.         return Math.log(param) / Math.log(2);  
  116.     }  
  117. }  

慢慢理解一下,还是容易明白的!

六、归并排序

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。
首先考虑下如何将将二个有序数列合并。这个非常简单,只要从比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。

 

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class SortTest {  
  4.   
  5.     // 将有序数组a[]和b[]合并到c[]中  
  6.     static void MemeryArray(int a[], int n, int b[], int m, int c[]) {  
  7.         int i, j, k;  
  8.   
  9.         i = j = k = 0;  
  10.         while (i < n && j < m) {  
  11.             if (a[i] < b[j])  
  12.                 c[k++] = a[i++];  
  13.             else  
  14.                 c[k++] = b[j++];  
  15.         }  
  16.   
  17.         while (i < n)  
  18.             c[k++] = a[i++];  
  19.   
  20.         while (j < m)  
  21.             c[k++] = b[j++];  
  22.     }  
  23.       
  24.     public static void main(String[] args) {  
  25.         int a[] = { 2, 7, 8, 10, 299 };  
  26.         int b[] = { 5, 9, 14, 20, 66, 88, 92 };  
  27.         int c[] = new int[a.length + b.length];  
  28.         MemeryArray(a, 5, b, 7, c);  
  29.         print(c);  
  30.     }  
  31.   
  32.     private static void print(int[] c) {  
  33.         for (int i = 0; i < c.length; i++) {  
  34.             System.out.print(c[i] + " ");  
  35.         }  
  36.     }  
  37. }  

可以看出合并有序数列的效率是比较高的,可以达到O(n)。解决了上面的合并有序数列问题,再来看归并排序,其的基本思路就是将数组分成二组A,B,如果这二组组内的数据都是有序的,那么就可以很方便的将这二组数据进行排序。如何让这二组组内数据有序了?可以将A,B组各自再分成二组。依次类推,当分出来的小组只有一个数据时,可以认为这个小组组内已经达到了有序,然后再合并相邻的二个小组就可以了。这样通过先递归的分解数列,再合并数列就完成了归并排序。下面是归并排序代码:

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class MergeSort {  
  4.   
  5.     private static void mergeSort(int[] data, int start, int end) {  
  6.         if (end > start) {  
  7.             int pos = (start + end) / 2;  
  8.             mergeSort(data, start, pos);  
  9.             mergeSort(data, pos + 1, end);  
  10.             merge(data, start, pos, end);  
  11.         }  
  12.     }  
  13.   
  14.     private static void merge(int[] data, int start, int pos, int end) {  
  15.         int len1 = pos - start + 1;  
  16.         int len2 = end - pos;  
  17.         int A[] = new int[len1 + 1];  
  18.         int B[] = new int[len2 + 1];  
  19.         for (int i = 0; i < len1; i++) {  
  20.             A[i] = data[i + start - 1];  
  21.         }  
  22.         A[len1] = Integer.MAX_VALUE;  
  23.         for (int i = 0; i < len2; i++) {  
  24.             B[i] = data[i + pos];  
  25.         }  
  26.         B[len2] = Integer.MAX_VALUE;  
  27.         int m = 0, n = 0;  
  28.         for (int i = start - 1; i < end; i++) {  
  29.             if (A[m] > B[n]) {  
  30.                 data[i] = B[n];  
  31.                 n++;  
  32.             } else {  
  33.                 data[i] = A[m];  
  34.                 m++;  
  35.             }  
  36.         }  
  37.     }  
  38.   
  39.     private static void print(int[] data) {  
  40.         for (int i = 0; i < data.length; i++) {  
  41.             System.out.print(data[i] + " ");  
  42.         }  
  43.     }  
  44.   
  45.     public static void main(String args[]) {  
  46.         int data[] = { 8, 16, 99, 732, 10, 1, 29, 66 };  
  47.         print(data);  
  48.         System.out.println();  
  49.         mergeSort(data, 1, data.length);  
  50.         print(data);  
  51.     }  
  52. }  

 

七、希尔排序(不稳定、O(nlogn))

d1 = n/2,d2 = d1/2 ...

举例一下:{9,8,7,6,5,4,3,2,1,0} 10个数,现分为5组(9,4),(8,3),(7,2),(6,1),(5,0),然后分别对每组进行直接插入排序得到:

(4,9),(3,8),(2,7),(1,6),(0,5),再将这5组分为2组(4,3,2,1,0),(9,8,7,6,5)分别对这两组进行直插排序,得:(0,1,2,3,4),(5,6,7,8,9)最终有序。

[java]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. package com.xtfggef.algo.sort;  
  2.   
  3. public class ShellSort {  
  4.   
  5.     static void shellsort(int[] a, int n) {  
  6.         int i, j, temp;  
  7.         int gap = 0;  
  8.         while (gap <= n) {  
  9.             gap = gap * 3 + 1;  
  10.         }  
  11.         while (gap > 0) {  
  12.             for (i = gap; i < n; i++) {  
  13.                 j = i - gap;  
  14.                 temp = a[i];  
  15.                 while ((j >= 0) && (a[j] > temp)) {  
  16.                     a[j + gap] = a[j];  
  17.                     j = j - gap;  
  18.                 }  
  19.                 a[j + gap] = temp;  
  20.             }  
  21.             gap = (gap - 1) / 3;  
  22.         }  
  23.     }  
  24.   
  25.     static void print(int data[]) {  
  26.         for (int i = 0; i < data.length; i++) {  
  27.             System.out.print(data[i] + " ");  
  28.         }  
  29.     }  
  30.   
  31.     public static void main(String[] args) {  
  32.         int data[] = { 2, 68, 7, 19, 1, 28, 66, 200 };  
  33.         print(data);  
  34.         System.out.println();  
  35.         shellsort(data, data.length);  
  36.         print(data);  
  37.     }  
  38. }  


八、多路快排

JDK1.8中Arrays.sort()采用的排序算法,具有较快的时间复杂度和稳定性,基本思路为:

1. 选取两个中轴P1, P2。

2. 假设P1<P2,否则交换。

3. 过程中原数组会分为四个部分:小于中轴1,大于中轴2,介于两个中轴之间,未排序部分(刚开始除了两个中轴,其它元素都属于这部分)。

4. 开始后,从未排序部分选取一个数,和两个中轴作比较,然后放到合适的位置,一直到未排序部分无数据,结束一趟排序。

5. 递归地处理子数组,稳定排序,时间复杂度稳定为O(nlogn)。

详情可以参见我的另一篇博文《Java之美[从菜鸟到高手演练]之Arrays类及其方法分析

 

九、其他排序

下面的一段转载自博友@清蒸水皮 --- 补充于2015年1月14日

==============================================

计数排序

当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 O(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。

由于用来计数的数组C的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。例如:计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。但是,计数排序可以用在基数排序中的算法来排序数据范围很大的数组。

算法的步骤如下:

  1. 找出待排序的数组中最大和最小的元素
  2. 统计数组中每个值为i的元素出现的次数,存入数组C的第i项
  3. 对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加)
  4. 反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1

贴上代码:

[cpp]  view plain  copy 在CODE上查看代码片派生到我的代码片
  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. #include <time.h>  
  4.   
  5. //对于排序的关键字范围,一定是0-99  
  6. #define NUM_RANGE (100)  
  7.   
  8. void print_arr(int *arr, int n)  
  9. {  
  10.        int i;  
  11.        for(i=0; i<n; i++){  
  12.                if(!i){  
  13.                        printf("%d", arr[i]);  
  14.                }else{  
  15.                        printf(" %d", arr[i]);  
  16.                }  
  17.        }  
  18.        printf("\n");  
  19. }  
  20.   
  21. /* 
  22. 算法的步骤如下: 
  23.     1.找出待排序的数组中最大和最小的元素 
  24.     2.统计数组中每个值为i的元素出现的次数,存入数组C的第i项 
  25.     3.对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加) 
  26.     4.反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1 
  27. */  
  28.   
  29. void counting_sort(int *ini_arr, int *sorted_arr, int n)  
  30. {  
  31.        int *count_arr = (int *)malloc(sizeof(int) * NUM_RANGE);  
  32.        int i, j, k;  
  33.   
  34.        //统计数组中,每个元素出现的次数  
  35.        for(k=0; k<NUM_RANGE; k++){  
  36.                count_arr[k] = 0;  
  37.        }  
  38.          
  39.        for(i=0; i<n; i++){  
  40.                count_arr[ini_arr[i]]++;  
  41.        }  
  42.   
  43.   
  44.        for(k=1; k<NUM_RANGE; k++){  
  45.                count_arr[k] += count_arr[k-1];  
  46.        }  
  47.   
  48.        for(j=n-1 ; j>=0; j--){  
  49.            int elem = ini_arr[j];  
  50.            int index = count_arr[elem]-1;  
  51.            sorted_arr[index] = elem;  
  52.            count_arr[elem]--;  
  53.        }  
  54.        free(count_arr);  
  55. }  
  56.   
  57.   
  58. int main(int argc, char* argv[])  
  59. {  
  60.        int n;  
  61.        if(argc < 2){  
  62.                n = 10;  
  63.        }else{  
  64.                n = atoi(argv[1]);  
  65.        }  
  66.        int i;  
  67.        int *arr = (int *)malloc(sizeof(int) * n);  
  68.        int *sorted_arr = (int *)malloc(sizeof(int) *n);  
  69.        srand(time(0));  
  70.   
  71.          
  72.        for(i=0; i<n; i++){  
  73.                arr[i] = rand() % NUM_RANGE;  
  74.        }  
  75.   
  76.        printf("ini_array: ");  
  77.        print_arr(arr, n);  
  78.        counting_sort(arr, sorted_arr, n);  
  79.        printf("sorted_array: ");  
  80.        print_arr(sorted_arr, n);  
  81.        free(arr);  
  82.        free(sorted_arr);  
  83.        return 0;  
  84. }  


桶排序

桶排序的基本思想

假设有一组长度为N的待排关键字序列K[1....n]。首先将这个序列划分成M个的子区间(桶) 。然后基于某种映射函数 ,将待排序列的关键字k映射到第i个桶中(即桶数组B的下标 i) ,那么该关键字k就作为B[i]中的元素(每个桶B[i]都是一组大小为N/M的序列)。接着对每个桶B[i]中的所有元素进行比较排序(可以使用快排)。然后依次枚举输出B[0]....B[M]中的全部内容即是一个有序序列。假如待排序列K= {49、 38 、 35、 97 、 76、 73 、 27、 49 }。这些数据全部在1—100之间。因此我们定制10个桶,然后确定映射函数f(k)=k/10。则第一个关键字49将定位到第4个桶中(49/10=4)。依次将所有关键字全部堆入桶中,并在每个非空的桶中进行快速排序。

桶排序代价分析
桶排序利用函数的映射关系,减少了几乎所有的比较工作。实际上,桶排序的f(k)值的计算,其作用就相当于快排中划分,已经把大量数据分割成了基本有序的数据块(桶)。然后只需要对桶中的少量数据做先进的比较排序即可。
 
对N个关键字进行桶排序的时间复杂度分为两个部分:
(1) 循环计算每个关键字的桶映射函数,这个时间复杂度是O(N)。
(2) 利用先进的比较排序算法对每个桶内的所有数据进行排序,其时间复杂度为 ∑ O(Ni*logNi) 。其中Ni 为第i个桶的数据量。
 
很显然,第(2)部分是桶排序性能好坏的决定因素。尽量减少桶内数据的数量是提高效率的唯一办法(因为基于比较排序的最好平均时间复杂度只能达到O(N*logN)了)。因此,我们需要尽量做到下面两点:
(1) 映射函数f(k)能够将N个数据平均的分配到M个桶中,这样每个桶就有[N/M]个数据量。
(2) 尽量的增大桶的数量。极限情况下每个桶只能得到一个数据,这样就完全避开了桶内数据的“比较”排序操作。 当然,做到这一点很不容易,数据量巨大的情况下,f(k)函数会使得桶集合的数量巨大,空间浪费严重。这就是一个时间代价和空间代价的权衡问题了。
 
对于N个待排数据,M个桶,平均每个桶[N/M]个数据的桶排序平均时间复杂度为:
O(N)+O(M*(N/M)*log(N/M))=O(N+N*(logN-logM))=O(N+N*logN-N*logM)
当N=M时,即极限情况下每个桶只有一个数据时。桶排序的最好效率能够达到O(N)。
 
总结: 桶排序的平均时间复杂度为线性的O(N+C),其中C=N*(logN-logM)。如果相对于同样的N,桶数量M越大,其效率越高,最好的时间复杂度达到O(N)。 当然桶排序的空间复杂度 为O(N+M),如果输入数据非常庞大,而桶的数量也非常多,则空间代价无疑是昂贵的。此外,桶排序是稳定的。
我个人还有一个感受:在查找算法中,基于比较的查找算法最好的时间复杂度也是O(logN)。比如折半查找、平衡二叉树、红黑树等。但是Hash表却有O(C)线性级别的查找效率(不冲突情况下查找效率达到O(1))。大家好好体会一下:Hash表的思想和桶排序是不是有一曲同工之妙呢?

 

基数排序

上面的问题是多关键字的排序,但单关键字也仍然可以使用这种方式。
比如字符串“abcd” “aesc” "dwsc" "rews"就可以把每个字符看成一个关键字。另外还有整数 425、321、235、432也可以每个位上的数字为一个关键字。
 
基数排序的思想就是将待排数据中的每组关键字依次进行桶分配。比如下面的待排序列:
278、109、063、930、589、184、505、269、008、083
我们将每个数值的个位,十位,百位分成三个关键字: 278 -> k1(个位)=8 ,k2(十位)=7 ,k3=(百位)=2。
然后从最低位个位开始(从最次关键字开始),对所有数据的k1关键字进行桶分配(因为,每个数字都是 0-9的,因此桶大小为10),再依次输出桶中的数据得到下面的序列。
930、063、083、184、505、278、008、109、589、269
再对上面的序列接着进行针对k2的桶分配,输出序列为:
505、008、109、930、063、269、278、083、184、589
最后针对k3的桶分配,输出序列为:
008、063、083、109、184、269、278、50



5、589、930
 
性能分析
很明显,基数排序的性能比桶排序要略差。每一次关键字的桶分配都需要O(N)的时间复杂度,而且分配之后得到新的关键字序列又需要O(N)的时间复杂度。假如待排数据可以分为d个关键字,则基数排序的时间复杂度将是O(d*2N) ,当然d要远远小于N,因此基本上还是线性级别的。基数排序的空间复杂度为O(N+M),其中M为桶的数量。一般来说N>>M,因此额外空间需要大概N个左右。
 
但是,对比桶排序,基数排序每次需要的桶的数量并不多。而且基数排序几乎不需要任何“比较”操作,而桶排序在桶相对较少的情况下,桶内多个数据必须进行基于比较操作的排序。因此,在实际应用中,基数排序的应用范围更加广泛。

 

=============================================



文章最后,给大家推荐一个数据结构学习的网站,有flash演示的:http://www.tyut.edu.cn/kecheng1/site01/index.asp

 

借鉴:http://blog.csdn.net/zhangerqing/article/details/8831542





    本文转自 一点点征服   博客园博客,原文链接:http://www.cnblogs.com/ldq2016/p/5260961.html,如需转载请自行联系原作者



相关文章
|
18天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
29 1
|
22天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
70 4
|
19天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
19天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
27天前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
89 23
|
27天前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
59 20
|
18天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
48 1
|
27天前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
47 0
|
27天前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
39 0
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
167 9