程序员必须掌握的排序算法:希尔排序的原理与实现

简介: 程序员必须掌握的排序算法:希尔排序的原理与实现

📋 前言

希尔排序,不知道大家有没有感觉听起来都很吊吊的样子。事实也确实如此,希尔排序的性能在八大排序中某些特定情况是最强的,也是我们必学的高效算法之一。

一、什么是希尔排序

希尔排序,也称为缩小增量排序,是插入排序的一种高效改进版本也可以把它

  • 看做为插入排序的优化版

希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序

二、希尔排序的思想与实现

既然希尔排序是分组来实现的,那么这样做的好处呢?其实是因为每次分组跳着来进行选择排序,可以更快的吧大数调整到后面:

而插入排序却需要需要排 N*N 次才能找到最大值(最坏情况)

如上图当排的分组的区间为2的时候每次只需要排一次就可以达到全部有序了。

2.1 希尔排序的版本一

当我们看到分组的时候肯定大部分想的都是 定义一个 gap组然后再进行每次排序一直重复到 1 ;

  • 这里需要注意的是数据被分成了 gap组那么每次进行交换
  • 都需要间隔 gap 组

而被分成了 gap 组那么每次都需要排序gap次所以需要一个外循环

🍸 代码演示:

// 希尔排序
void ShellSort(int* a, int n)
{
  //方法一普通想法
  int gap = 3;
  for (int j = gap; j > 0; j--)
  {
    for (int i = j; i < n-j; i++)
    {
      int end = i;
      int tmp = a[end+j];
      while (end >= 0)
      {
        if (a[end] > tmp)
        {
          a[end + j] = a[end];
        }
        else
        {
          break;
        }
        end = end-j;
      }
      a[end + j] = tmp;
    }
  }
}

以上就是普通实现的希尔排序的代码了,而第二组排序的时候就是从第二个数据开始了:

  • 所以 i = j, 而每次需要跨越 gap 个数据

2.2 希尔排序的优化版本

但是上述代码有很大的局限性,希尔排序在排序每次 需要的 gap 分组都不一样:

  • 一般我们是采用 gap = n/2
  • 优化一下也可以写成 gap = n/3 +1

gap = n/3 +1 为什么要+1 呢因为当时候 2/3 的时候编译器回默认为 0 ,但我们这次还需要再排序一次数据所以需要+1;

🍸 代码演示:

void ShellSort(int* a, int n)
{
  int gap = n;
  while (gap > 1)
  {
    gap = gap / 3 + 1;
    for (int i = 0; i < n - gap; i++)
    {
      int end = i;
      int tmp = a[end + gap];
      while (end >= 0)
      {
        if (a[end] > tmp)
        {
          a[end + gap] = a[end];
          end -= gap;
        }
        else
        {
          break;
        }
      }
      a[end + gap] = tmp;
    }
  }
}

二、希尔排序的性能

希尔排序的特性总结:

  1. 希尔排序是对直接插入排序的优化。
  2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
  3. 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些树中给出的希尔排序的时间复杂度都不固定:

《数据结构(C语言版)》— 严蔚敏

《数据结构-用面相对象方法与C++描述》— 殷人昆

因为咋们的gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,我们暂时就按照:O ( n 1.25 ) O(n^{1.25})O(n1.25)O ( 1.6 ∗ n 1.25 ) O(1.6*n^{1.25})O(1.6n1.25)来算。

  1. 稳定性:不稳定
目录
相关文章
|
2月前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
56 3
|
2月前
|
机器学习/深度学习 算法 机器人
多代理强化学习综述:原理、算法与挑战
多代理强化学习是强化学习的一个子领域,专注于研究在共享环境中共存的多个学习代理的行为。每个代理都受其个体奖励驱动,采取行动以推进自身利益;在某些环境中,这些利益可能与其他代理的利益相冲突,从而产生复杂的群体动态。
272 5
|
1天前
|
算法 Java 数据库
理解CAS算法原理
CAS(Compare and Swap,比较并交换)是一种无锁算法,用于实现多线程环境下的原子操作。它通过比较内存中的值与预期值是否相同来决定是否进行更新。JDK 5引入了基于CAS的乐观锁机制,替代了传统的synchronized独占锁,提升了并发性能。然而,CAS存在ABA问题、循环时间长开销大和只能保证单个共享变量原子性等缺点。为解决这些问题,可以使用版本号机制、合并多个变量或引入pause指令优化CPU执行效率。CAS广泛应用于JDK的原子类中,如AtomicInteger.incrementAndGet(),利用底层Unsafe库实现高效的无锁自增操作。
理解CAS算法原理
|
1月前
|
算法 容器
令牌桶算法原理及实现,图文详解
本文介绍令牌桶算法,一种常用的限流策略,通过恒定速率放入令牌,控制高并发场景下的流量,确保系统稳定运行。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
令牌桶算法原理及实现,图文详解
|
22天前
|
存储 人工智能 缓存
【AI系统】布局转换原理与算法
数据布局转换技术通过优化内存中数据的排布,提升程序执行效率,特别是对于缓存性能的影响显著。本文介绍了数据在内存中的排布方式,包括内存对齐、大小端存储等概念,并详细探讨了张量数据在内存中的排布,如行优先与列优先排布,以及在深度学习中常见的NCHW与NHWC两种数据布局方式。这些布局方式的选择直接影响到程序的性能,尤其是在GPU和CPU上的表现。此外,还讨论了连续与非连续张量的概念及其对性能的影响。
45 3
|
27天前
|
机器学习/深度学习 人工智能 算法
探索人工智能中的强化学习:原理、算法与应用
探索人工智能中的强化学习:原理、算法与应用
|
1月前
|
负载均衡 算法 应用服务中间件
5大负载均衡算法及原理,图解易懂!
本文详细介绍负载均衡的5大核心算法:轮询、加权轮询、随机、最少连接和源地址散列,帮助你深入理解分布式架构中的关键技术。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
5大负载均衡算法及原理,图解易懂!
|
1月前
|
缓存 算法 网络协议
OSPF的路由计算算法:原理与应用
OSPF的路由计算算法:原理与应用
49 4
|
1月前
|
存储 算法 网络协议
OSPF的SPF算法介绍:原理、实现与应用
OSPF的SPF算法介绍:原理、实现与应用
82 3
|
27天前
|
机器学习/深度学习 人工智能 算法
探索人工智能中的强化学习:原理、算法及应用
探索人工智能中的强化学习:原理、算法及应用