【数据结构和算法】--- 基于c语言排序算法的实现(1)

简介: 【数据结构和算法】--- 基于c语言排序算法的实现(1)

一、排序的概念及其应用

1.1排序的概念

排序: 所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。

稳定性:定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

内部排序: 数据元素全部放在内存中的排序。

外部排序: 数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。

1.2 排序的应用

以下是 “软科中国大学排名” 情况,这便是日常生活中排序的应用,此处排序标准为,以各个大学的总分作为唯一标准,进行降序排序。 此处的排序便是由排序算法实现,下面将对不同的排序算法进行剖析。

1.3 常见的排序算法

下面将基于c语言,对以上七种排序逐一实现。

二、插入排序

2.1直接插入排序

基本思想:

直接插入排序是一种简单的插入排序法,其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。

我们可以将直接插入排序想象成玩扑克牌,即每当我们拿到一张牌,然后插入到我们手上已排好序的牌中,从小到大直到找到合适的位置然后插入,以此循环直到排完序为止。

依据上述方法,我们可以先排数组的前两个数。第一个数作为已排好序的数组,第二个数作为要插入数组的数,插入完成后,将上述所有已插入的数作为已排好序的数组,然后再向后取一个数执行上述逻辑。 以此作为循环的主体,直到取完数组中所有的数,即当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移。

代码实现:

//直接插入排序
void InsertSort(int* a, int n)
{
  for(int i = 0; i < n - 1; i++)
  {
    //[0, end] 已排好序的数组
    int end = i;
    int tmp = a[end + 1];//要插入的数
    //tmp 向前比较 -- 小于前一个数,则 a[end] 向后拷贝,end--,继续比较前一个数
    //大于则说明 tmp 到了合适的位置
    while(end >= 0)
    {
      if(tmp <= a[end])
      {
        a[end + 1] = a[end];
        end--;
      }
      else
      {
        break;
      }
    }
    //比较完成,插入!
    a[end + 1] = tmp;
  }
}

代码实现时几点注意

  • 确定好要以排好序的数组范围(下标为0 ~ n - 2)n -1位置是最后一个要插入的数;
  • 要插入的数为已排好序的数组最后一个元素(end = i)的下一个(tmp = a[end + 1),使用tmp记录;
  • tmp向前比较,小于a[end]则继续比较前一个,当前a[end]向后拷贝,并使end--直到tmp大于a[end],或end < 0,则结束,并使a[end] = tmp

直接插入排序动态演示:

直接插入排序的特性总结:

  1. 元素集合越接近有序,直接插入排序算法的时间效率越高
  2. 时间复杂度: O(N^2)
  3. 空间复杂度: O(1),它是一种稳定的排序算法;
  4. 稳定性: 稳定

2.2 希尔排序

希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。


根据元素集合越接近有序,直接插入排序算法的时间效率越高的规律,那么我们可以想方法先把一堆数据排的接近有序(预排序),然后再进行直接插入排序


2.2.1 预排序

可以定义gap来表示每次预排序的元素的跨度(即每次趟排序的数组下标相隔的值),这时gap也表示整个数组要排序的趟数。大致如下图所示:

gap趟中的每一趟,又是直接插入排序。那么在直接插入排序的基础上,我们只需要控制一下初始值,下标增值和结束条件即可,如:for(int j = i; j < n - gap; j += gap),其中n - gap是因为,每趟排序的最后一个元素都在整个数组的后gap个,又因为直接插入排序最后一个位置不取,所以要< n - gap。代码如下:

//预排序(以 gap = 3 为例)
int gap = 3;
//gap 趟
for(int i = 0; i < gap; i++)
{
  //直接插入排序
  for(int j = i; j < n - gap; j += gap)
  {
    int end = j;
    int tmp = a[end + gap];
    while(end >= 0)
    {
      if(tmp <= a[end])
      {
        a[end + gap] = a[end];
        end -= gap;
      }
      else
      {
        break;
      }
    }
    a[end + gap] = tmp; 
  }
}

当然还可以对上面代码进行一点小优化可以将外层两个for循环改成一个:for(int j = 0; j < n - gap; j++) 事实上循环总次数是不变的,我们只是将原来先排好第一组再排后面组的思路,改成了混在一起排,效果还是一样的。由一组一组排变为了多组并排。


2.2.2 缩小gap

有了预排序,那么我们只要合理的控制gap的大小,便完成了希尔排序。如:gap = gap / x + 1,其中的x可以根据具体的待排序的数组的长度来决定。 待排序数组长,则x设置较大一些;待排序数组短,则x设置较小一些。gap / x后还要加一,是为了让排序的最后一趟gap = 1,即直接插入排序。

//希尔排序(缩小增量排序)
void ShellSort(int* a, int n)
{
  int gap = n;
  //gap > 1 时是预排序,目的是让他接近有序
  //ga[ = 1 时是直接插入排序,目的是让他有序
  while(gap > 1)
  {
    gap = gap / 3 + 1;  //加1是为了让他最后一次 gap = 1
    //预排序
    // ....
  }
}

排序整体逻辑基本如下:

2.2.3 小结

希尔排序的特性总结:

  1. 希尔排序是对直接插入排序的优化。
  2. gap > 1时都是预排序,目的是让数组更接近于有序。如此一来,当gap == 1时,数组已经接近有序的了,这样效率也会很高。这样整体而言,可以达到优化的效果。
  3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定:

   《数据结构(C语言版)》— 严蔚敏

《数据结构-用面相对象方法与C++描述》— 殷人昆

因为咋们的gap是按照 Knuth 提出的方式取值的,而且 Knuth 进行了大量的试验统计,我们暂时就按照:O(N^1.25)到 O(1.6 * N^1.25)来算。

  1. gap越大,大的值越快跳到后面,小的值越快跳到前面,越不接近有序;gap越小,大的之越慢跳到后面,小的值越慢跳到前面,越接近有序;
  2. 稳定性: 不稳定


三、选择排序

3.1 直接选择排序

基本思想:

每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。

直接插入排序动态演示:

上述的方法是从头遍历到尾,找最小值,然后插入到目标位置,事实上效率并不是很高,于是我们可以这样进行点小优化:定义一个变量int begin = 0,从下标为begin的位置向后找小,再定义一个变量int end = n - 1,从下标为begin的位置向后找大,待循环结束大值和下标为end的值交换,小值和下标为begin的值交换,然后begin++; end--;,直到begin == end排序结束。这样每次循环都会找到两个目标值,且缩小了下一次搜索的范围,达到了优化的效果。

代码实现:

//直接插入选择(优化)
void SelectSort(int* a, int n)
{
  int begin = 0, end = n - 1;
  //记录 较大值 和 较小值 的下标
  int mini = begin, maxi = degin;
  while(begin < end)
  {
      //找大值和小值
    for(int i = begin + 1; i < end + 1; i++)
    {
      if(a[i] < a[mini])
        mini = i;
      if(a[i] > a[maxi])
        maxi = i;
    }
    //交换
    Swap(&a[begin], &a[mini]);
    //判断防止最大值丢失
    if(maxi == begin)
      maxi = mini;
    Swap(&a[end], &a[maxi]);
    ++begin;
    --end;
  }
}

还有一点需要注意的是,交换完一个值我们要先判断,看最大值是否在begin位置,if(maxi == begin),若在,则将maxi换到mini位置。逻辑大致如下:

直接选择排序的特性总结:

  1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
  2. 时间复杂度: O(N^2)
  3. 空间复杂度: O(1)
  4. 稳定性: 不稳定

3.2 堆排序

堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。


直接选择排序的特性总结:

  1. 堆排序使用堆来选数,效率就高了很多。
  2. 时间复杂度: O(N*logN)
  3. 空间复杂度: O(1)
  4. 稳定性: 不稳定
目录
打赏
0
0
0
0
4
分享
相关文章
|
1月前
|
算法系列之数据结构-二叉树
树是一种重要的非线性数据结构,广泛应用于各种算法和应用中。本文介绍了树的基本概念、常见类型(如二叉树、满二叉树、完全二叉树、平衡二叉树、B树等)及其在Java中的实现。通过递归方法实现了二叉树的前序、中序、后序和层次遍历,并展示了具体的代码示例和运行结果。掌握树结构有助于提高编程能力,优化算法设计。
62 9
 算法系列之数据结构-二叉树
|
1月前
|
算法系列之数据结构-Huffman树
Huffman树(哈夫曼树)又称最优二叉树,是一种带权路径长度最短的二叉树,常用于信息传输、数据压缩等方面。它的构造基于字符出现的频率,通过将频率较低的字符组合在一起,最终形成一棵树。在Huffman树中,每个叶节点代表一个字符,而每个字符的编码则是从根节点到叶节点的路径所对应的二进制序列。
69 3
 算法系列之数据结构-Huffman树
算法系列之排序算法-堆排序
堆排序(Heap Sort)是一种基于堆数据结构的比较排序算法。它的时间复杂度为 $O(nlogn)$,并且是一种原地排序算法(即不需要额外的存储空间)。堆排序的核心思想是利用堆的性质来维护一个最大堆或最小堆,然后逐步将堆顶元素(最大值或最小值)取出,放到数组的末尾,最终得到一个有序的数组。
55 8
算法系列之排序算法-堆排序
|
1月前
|
算法系列之数据结构-二叉搜索树
二叉查找树(Binary Search Tree,简称BST)是一种常用的数据结构,它能够高效地进行查找、插入和删除操作。二叉查找树的特点是,对于树中的每个节点,其左子树中的所有节点都小于该节点,而右子树中的所有节点都大于该节点。
86 22
JavaScript 中通过Array.sort() 实现多字段排序、排序稳定性、随机排序洗牌算法、优化排序性能,JS中排序算法的使用详解(附实际应用代码)
Array.sort() 是一个功能强大的方法,通过自定义的比较函数,可以处理各种复杂的排序逻辑。无论是简单的数字排序,还是多字段、嵌套对象、分组排序等高级应用,Array.sort() 都能胜任。同时,通过性能优化技巧(如映射排序)和结合其他数组方法(如 reduce),Array.sort() 可以用来实现高效的数据处理逻辑。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
C 408—《数据结构》算法题基础篇—链表(下)
408考研——《数据结构》算法题基础篇之链表(下)。
114 29
c语言及数据结构实现简单贪吃蛇小游戏
c语言及数据结构实现简单贪吃蛇小游戏
C 408—《数据结构》算法题基础篇—链表(上)
408考研——《数据结构》算法题基础篇之链表(上)。
145 25
C 408—《数据结构》算法题基础篇—数组(通俗易懂)
408考研——《数据结构》算法题基础篇之数组。(408算法题的入门)
119 23
数据结构(C语言)之对归并排序的介绍与理解
归并排序是一种基于分治策略的排序算法,通过递归将数组不断分割为子数组,直到每个子数组仅剩一个元素,再逐步合并这些有序的子数组以得到最终的有序数组。递归版本中,每次分割区间为[left, mid]和[mid+1, right],确保每两个区间内数据有序后进行合并。非递归版本则通过逐步增加gap值(初始为1),先对单个元素排序,再逐步扩大到更大的区间进行合并,直至整个数组有序。归并排序的时间复杂度为O(n*logn),空间复杂度为O(n),且具有稳定性,适用于普通排序及大文件排序场景。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等