【Python排序算法系列】—— 希尔排序

简介: 【Python排序算法系列】—— 希尔排序



希尔排序 (ShellSort)

由来和特点

希尔排序是一种高效的排序算法,由美国计算机科学家Donald Shell于1959年提出。希尔排序基于插入排序算法,通过比较相距一定间隔的元素来把元素移动到最终位置,从而实现排序。

希尔排序的基本思想是将待排序的数组按照一定的间隔分成若干个子序列,对子序列进行插入排序,然后缩小间隔,重复进行插入排序,直到间隔为1,最后通过插入排序将整个序列排序完成。

希尔排序的特点:

1. 缩小增量希尔排序的一大特点是将数组分成若干个子序列进行排序,通过缩小增量的方式减少了插入排序的次数。增量的选择有多种方法常用的是二分法,即每次将增量除以2,直到增量变为1为止。

2. 分组插入排序希尔排序将数组按照一定的间隔分成若干个子序列,对每个子序列进行插入排序。由于子序列的长度较短,插入排序的时间复杂度较低,从而提高了排序的效率。

3. 大幅度减少逆序对由于希尔排序是通过间隔分组进行插入排序的,每次排序都会将相距较远的元素进行比较和交换,从而大幅度减少了逆序对的数量。逆序对的数量是衡量一个排序算法效率的指标,逆序对越少,排序效率越高。

4. 非稳定性希尔排序是一种非稳定的排序算法。在排序过程中,相同大小的元素可能会发生交换,导致原来相对顺序的改变。

总结起来,希尔排序是一种高效的排序算法,通过缩小增量和分组插入排序的方式,大幅度减少了逆序对的数量,从而提高了排序效率。虽然希尔排序存在一定的非稳定性,但在实际应用中并不影响排序结果的正确性。希尔排序在大多数情况下都能够比较好地工作,并且适用于各种规模的数据集。

理解

希尔排序是插入排序的优化,他把整个列表按照定义的gap(为步长【也叫增量】)切割【隔着gap切割而非连续切割】成多个子列表,然后对子列表进行排序,排完序以后的整个列表,若还是存在无序,我们可以将增量递减,继续进行插入排序,直到增量为1,当增量为1的时候整个列表直接进行插入排序,此时,已经在前面排好的基础上进一步进行插排,因此希尔排序在最后进行插排的时候比整个无序表进行插排的速度快很多。

子列表的个数 = 步长

过程演示

Step1:

希尔排序第一步:这里我们选择二分法, 按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表的长度是9,所以它的步长gap = 9 / / 2 = 4,如上图切割成4个子列表。

【注意】:实际上他不会像图上一样分开成四个,而是按照原来的进行切分,只是为了更好的理解,我们才分开画的。


Step2:

第二轮,继续按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表个数是4,所以它的步长gap = 4 / / 2 = 2,如下图切割成2个子列表。


Step3:

第三轮,继续按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表的个数是2,所以它的步长gap = 2 / / 2 = 1,如下图切割成1个子列表。


实现代码:

#切割列表,然后利用for循环进行插排
def shell_sort(alist):
    sublistcount = len(alist) // 2 #切割子列表的步长
    while sublistcount > 0:  #只要还可以切割
        # 通过循环遍历每个字列表
        for i in range(sublistcount):
            insert_sort(alist, i , sublistcount) #对每一个子列表进行插排
        sublistcount = sublistcount // 2 #改变步长的长度
    return alist
# 定义插排的函数
def insert_sort(alist, start, gap):
    for i in range(start +gap, len(alist), gap):
        currentvalue = alist[i] #记录当前循环列表里的值
        position = i #记录当前位置
        while position >= gap and alist[position - gap] > currentvalue:
            alist[position] = alist[position - gap] #整体后移
            position = position - gap # 记录当前位置
        alist[position] = currentvalue#当前位置等于要插入的那个位置
li = [54,26,93,17,77,31,44,55,20]
print(shell_sort(li))

Self Check

我的解题思路:

根据希尔排序的特点,根据gap先进行分组然后进行跳跃切割。

题目中的gap = 3,所以我们首先可以知道要分三组:

他们的下标和对应的分组元素如下图所示

然后每组按照插入排序的方法进行排序

最后排完的结果是: 5 , 3, 8 , 7 , 16, 19 , 9 , 17, 20, 12。


📝总结:

粗看上去,谢尔排序以插入排序为基础可能并不会比插入排序好,但由于每趟都使得列表更加接近有序,这个过程会减少很多原先需要的“无效”比对

对谢尔排序的详尽分析比较复杂,大致说是介于0(n)和0(n²)之间

如果将间隔保持在2^(k) - 1(1、3、5、7、15、31等等),谢尔排序的时间复杂度约为0 ( n^(3/2))

 

目录
相关文章
|
2月前
|
算法 数据可视化 数据挖掘
基于EM期望最大化算法的GMM参数估计与三维数据分类系统python源码
本内容展示了基于EM算法的高斯混合模型(GMM)聚类实现,包含完整Python代码、运行效果图及理论解析。程序使用三维数据进行演示,涵盖误差计算、模型参数更新、结果可视化等关键步骤,并附有详细注释与操作视频,适合学习EM算法与GMM模型的原理及应用。
|
2月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
62 1
|
2月前
|
存储 监控 算法
基于 Python 跳表算法的局域网网络监控软件动态数据索引优化策略研究
局域网网络监控软件需高效处理终端行为数据,跳表作为一种基于概率平衡的动态数据结构,具备高效的插入、删除与查询性能(平均时间复杂度为O(log n)),适用于高频数据写入和随机查询场景。本文深入解析跳表原理,探讨其在局域网监控中的适配性,并提供基于Python的完整实现方案,优化终端会话管理,提升系统响应性能。
72 4
|
4月前
|
算法 Python
Apriori算法的Python实例演示
经过运行,你会看到一些集合出现,每个集合的支持度也会给出。这些集合就是你想要的,经常一起被购买的商品组合。不要忘记,`min_support`参数将决定频繁项集的数量和大小,你可以根据自己的需要进行更改。
161 18
|
4月前
|
存储 机器学习/深度学习 算法
论上网限制软件中 Python 动态衰减权重算法于行为管控领域的创新性应用
在网络安全与行为管理的学术语境中,上网限制软件面临着精准识别并管控用户不合规网络请求的复杂任务。传统的基于静态规则库或固定阈值的策略,在实践中暴露出较高的误判率与较差的动态适应性。本研究引入一种基于 “动态衰减权重算法” 的优化策略,融合时间序列分析与权重衰减机制,旨在显著提升上网限制软件的实时决策效能。
127 2
|
5月前
|
算法 数据可视化 Python
Python中利用遗传算法探索迷宫出路
本文探讨了如何利用Python和遗传算法解决迷宫问题。迷宫建模通过二维数组实现,0表示通路,1为墙壁,'S'和'E'分别代表起点与终点。遗传算法的核心包括个体编码(路径方向序列)、适应度函数(评估路径有效性)、选择、交叉和变异操作。通过迭代优化,算法逐步生成更优路径,最终找到从起点到终点的最佳解决方案。文末还展示了结果可视化方法及遗传算法的应用前景。
146 5
|
5月前
|
存储 监控 算法
基于 Python 哈希表算法的局域网网络监控工具:实现高效数据管理的核心技术
在当下数字化办公的环境中,局域网网络监控工具已成为保障企业网络安全、确保其高效运行的核心手段。此类工具通过对网络数据的收集、分析与管理,赋予企业实时洞察网络活动的能力。而在其运行机制背后,数据结构与算法发挥着关键作用。本文聚焦于 PHP 语言中的哈希表算法,深入探究其在局域网网络监控工具中的应用方式及所具备的优势。
146 7
|
5月前
|
存储 监控 算法
员工电脑监控场景下 Python 红黑树算法的深度解析
在当代企业管理范式中,员工电脑监控业已成为一种广泛采用的策略性手段,其核心目标在于维护企业信息安全、提升工作效能并确保合规性。借助对员工电脑操作的实时监测机制,企业能够敏锐洞察潜在风险,诸如数据泄露、恶意软件侵袭等威胁。而员工电脑监控系统的高效运作,高度依赖于底层的数据结构与算法架构。本文旨在深入探究红黑树(Red - Black Tree)这一数据结构在员工电脑监控领域的应用,并通过 Python 代码实例详尽阐释其实现机制。
108 7
|
5月前
|
运维 监控 算法
基于 Python 迪杰斯特拉算法的局域网计算机监控技术探究
信息技术高速演进的当下,局域网计算机监控对于保障企业网络安全、优化资源配置以及提升整体运行效能具有关键意义。通过实时监测网络状态、追踪计算机活动,企业得以及时察觉潜在风险并采取相应举措。在这一复杂的监控体系背后,数据结构与算法发挥着不可或缺的作用。本文将聚焦于迪杰斯特拉(Dijkstra)算法,深入探究其在局域网计算机监控中的应用,并借助 Python 代码示例予以详细阐释。
121 6

热门文章

最新文章

推荐镜像

更多