【Python排序算法系列】—— 希尔排序

简介: 【Python排序算法系列】—— 希尔排序



希尔排序 (ShellSort)

由来和特点

希尔排序是一种高效的排序算法,由美国计算机科学家Donald Shell于1959年提出。希尔排序基于插入排序算法,通过比较相距一定间隔的元素来把元素移动到最终位置,从而实现排序。

希尔排序的基本思想是将待排序的数组按照一定的间隔分成若干个子序列,对子序列进行插入排序,然后缩小间隔,重复进行插入排序,直到间隔为1,最后通过插入排序将整个序列排序完成。

希尔排序的特点:

1. 缩小增量希尔排序的一大特点是将数组分成若干个子序列进行排序,通过缩小增量的方式减少了插入排序的次数。增量的选择有多种方法常用的是二分法,即每次将增量除以2,直到增量变为1为止。

2. 分组插入排序希尔排序将数组按照一定的间隔分成若干个子序列,对每个子序列进行插入排序。由于子序列的长度较短,插入排序的时间复杂度较低,从而提高了排序的效率。

3. 大幅度减少逆序对由于希尔排序是通过间隔分组进行插入排序的,每次排序都会将相距较远的元素进行比较和交换,从而大幅度减少了逆序对的数量。逆序对的数量是衡量一个排序算法效率的指标,逆序对越少,排序效率越高。

4. 非稳定性希尔排序是一种非稳定的排序算法。在排序过程中,相同大小的元素可能会发生交换,导致原来相对顺序的改变。

总结起来,希尔排序是一种高效的排序算法,通过缩小增量和分组插入排序的方式,大幅度减少了逆序对的数量,从而提高了排序效率。虽然希尔排序存在一定的非稳定性,但在实际应用中并不影响排序结果的正确性。希尔排序在大多数情况下都能够比较好地工作,并且适用于各种规模的数据集。

理解

希尔排序是插入排序的优化,他把整个列表按照定义的gap(为步长【也叫增量】)切割【隔着gap切割而非连续切割】成多个子列表,然后对子列表进行排序,排完序以后的整个列表,若还是存在无序,我们可以将增量递减,继续进行插入排序,直到增量为1,当增量为1的时候整个列表直接进行插入排序,此时,已经在前面排好的基础上进一步进行插排,因此希尔排序在最后进行插排的时候比整个无序表进行插排的速度快很多。

子列表的个数 = 步长

过程演示

Step1:

希尔排序第一步:这里我们选择二分法, 按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表的长度是9,所以它的步长gap = 9 / / 2 = 4,如上图切割成4个子列表。

【注意】:实际上他不会像图上一样分开成四个,而是按照原来的进行切分,只是为了更好的理解,我们才分开画的。


Step2:

第二轮,继续按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表个数是4,所以它的步长gap = 4 / / 2 = 2,如下图切割成2个子列表。


Step3:

第三轮,继续按照步长 gap = len (alist) / /  2 进行列表的切割。

原来的无序表的个数是2,所以它的步长gap = 2 / / 2 = 1,如下图切割成1个子列表。


实现代码:

#切割列表,然后利用for循环进行插排
def shell_sort(alist):
    sublistcount = len(alist) // 2 #切割子列表的步长
    while sublistcount > 0:  #只要还可以切割
        # 通过循环遍历每个字列表
        for i in range(sublistcount):
            insert_sort(alist, i , sublistcount) #对每一个子列表进行插排
        sublistcount = sublistcount // 2 #改变步长的长度
    return alist
# 定义插排的函数
def insert_sort(alist, start, gap):
    for i in range(start +gap, len(alist), gap):
        currentvalue = alist[i] #记录当前循环列表里的值
        position = i #记录当前位置
        while position >= gap and alist[position - gap] > currentvalue:
            alist[position] = alist[position - gap] #整体后移
            position = position - gap # 记录当前位置
        alist[position] = currentvalue#当前位置等于要插入的那个位置
li = [54,26,93,17,77,31,44,55,20]
print(shell_sort(li))

Self Check

我的解题思路:

根据希尔排序的特点,根据gap先进行分组然后进行跳跃切割。

题目中的gap = 3,所以我们首先可以知道要分三组:

他们的下标和对应的分组元素如下图所示

然后每组按照插入排序的方法进行排序

最后排完的结果是: 5 , 3, 8 , 7 , 16, 19 , 9 , 17, 20, 12。


📝总结:

粗看上去,谢尔排序以插入排序为基础可能并不会比插入排序好,但由于每趟都使得列表更加接近有序,这个过程会减少很多原先需要的“无效”比对

对谢尔排序的详尽分析比较复杂,大致说是介于0(n)和0(n²)之间

如果将间隔保持在2^(k) - 1(1、3、5、7、15、31等等),谢尔排序的时间复杂度约为0 ( n^(3/2))

 

目录
相关文章
|
1月前
|
算法 前端开发 数据处理
小白学python-深入解析一位字符判定算法
小白学python-深入解析一位字符判定算法
46 0
|
2天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
15 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
2天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
11 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
9 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
6天前
|
算法 Python
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果;贪心算法在每一步选择局部最优解,追求全局最优;动态规划通过保存子问题的解,避免重复计算,确保全局最优。这三种算法各具特色,适用于不同类型的问题,合理选择能显著提升编程效率。
24 2
|
1月前
|
存储 机器学习/深度学习 算法
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
蓝桥杯Python编程练习题的集合,涵盖了从基础到提高的多个算法题目及其解答。
57 3
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
|
15天前
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
18 3
|
18天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
61 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
23天前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
1月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
52 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练