Python3 数据结构与算法之计数排序

简介: Python3 数据结构与算法之计数排序

本文讲述一个在编程过程中并不是很常见的一种排序算法——计数排序。


计数排序

根据这个排序的名字,我们不难想到该排序的主体就在于计数二字上,那么具体有什么数字需要我们记录呢,下面通过一个例子来简单的说明一下。

这里给定一个数组:

arr = [2, 3, 5, 14, 5, 7, 22, 7, 7, 11]

我们能看到一个数组中的数字不仅是大小不一的,还有可能是重复的,既然有重复的数据,那么我们就先来讲这些重复的数据找出来并做一定的标记。


我们既想要记录每个数字是多少又想要记录出现的次数,你可能会想到二维数组、字典等等的数据结构,我在这里给出一个很简单的思想用一个一维数组解决这个问题,首先我们定义一个长度为max(arr)-min(arr)+1的数组countArr,有个这个较长的数组后,我们就可以用索引来表示数字的值用数组的空间去存储该值出现的次数,来用代码实现以下这个操作:

    maxnum = max(arr)
    minnum = min(arr)
    countArr_length = maxnum - minnum + 1
    countArr = [0 for i in range(countArr_length)]
    # 统计每个数字出现的次数,存在计数数组中。
    for i in arr:
        countArr[i - minnum] += 1

每一次循环的结果如下:

12.png

有了这个数组,我们只需要将每个数在一个新的数组中填入到他们相应的位置并输出即可,全部代码如下:

def count_sort(arr):
    maxnum = max(arr)
    minnum = min(arr)
    countArr_length = maxnum - minnum + 1
    countArr = [0 for i in range(countArr_length)]
    res = [0 for i in range(len(arr))]
    # 统计每个数字出现的次数,存在计数数组中。
    for i in arr:
        countArr[i - minnum] += 1
    # 统计每个数字前面有几个比自己小的数,并更新到计数数组中。
    for j in range(1, countArr_length):
        countArr[j] = countArr[j] + countArr[j - 1]
    # 根据每个数字前面有几位比自己小的数的个数进行输出。
    for k in range(len(arr)):
        res[countArr[arr[k] - minnum] - 1] = arr[k]
        countArr[arr[k] - minnum] -= 1
    return res
arr = [2, 3, 5, 14, 5, 7, 22, 7, 7, 11]
print(count_sort(arr))

排序结果如下:

13.png

说明一下代码中最后一个循环中的内容:


res[countArr[arr[k] - minnum] - 1] = arr[k],该步骤用于寻找数字arr[k]之前有几个比他的数字n,并把数字arr[k]放在n-1的位置上(-1是因为索引需要从0开始)。


countArr[arr[k] - minnum] -= 1,该步骤将上一步中排序好的数字弹出再集训进行循环。


复杂度:

假定原始数列的规模是N,最大值和最小值的差是M,计数排序的时间复杂度是O(N+M),如果不考虑结果数组,只考虑中间数组大小的话,空间复杂度是O(M)。


计数排序的局限性:

1、当数列的最大和最小值差距过大时,并不适用计数排序。

2、当数列元素不是整数,并不适用计数排。

目录
打赏
0
0
0
0
16
分享
相关文章
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
Python数据结构:列表、元组、字典、集合
Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。
如何在Python下实现摄像头|屏幕|AI视觉算法数据的RTMP直播推送
本文详细讲解了在Python环境下使用大牛直播SDK实现RTMP推流的过程。从技术背景到代码实现,涵盖Python生态优势、AI视觉算法应用、RTMP稳定性及跨平台支持等内容。通过丰富功能如音频编码、视频编码、实时预览等,结合实际代码示例,为开发者提供完整指南。同时探讨C接口转换Python时的注意事项,包括数据类型映射、内存管理、回调函数等关键点。最终总结Python在RTMP推流与AI视觉算法结合中的重要性与前景,为行业应用带来便利与革新。
基于 Python 哈希表算法的员工上网管理策略研究
于当下数字化办公环境而言,员工上网管理已成为企业运营管理的关键环节。企业有必要对员工的网络访问行为予以监控,以此确保信息安全并提升工作效率。在处理员工上网管理相关数据时,适宜的数据结构与算法起着举足轻重的作用。本文将深入探究哈希表这一数据结构在员工上网管理场景中的应用,并借助 Python 代码示例展开详尽阐述。
31 3
Python下的毫秒级延迟RTSP|RTMP播放器技术探究和AI视觉算法对接
本文深入解析了基于Python实现的RTSP/RTMP播放器,探讨其代码结构、实现原理及优化策略。播放器通过大牛直播SDK提供的接口,支持低延迟播放,适用于实时监控、视频会议和智能分析等场景。文章详细介绍了播放控制、硬件解码、录像与截图功能,并分析了回调机制和UI设计。此外,还讨论了性能优化方法(如硬件加速、异步处理)和功能扩展(如音量调节、多格式支持)。针对AI视觉算法对接,文章提供了YUV/RGB数据处理示例,便于开发者在Python环境下进行算法集成。最终,播放器凭借低延迟、高兼容性和灵活扩展性,为实时交互场景提供了高效解决方案。
探秘文件共享服务之哈希表助力 Python 算法实现
在数字化时代,文件共享服务不可或缺。哈希表(散列表)通过键值对存储数据,利用哈希函数将键映射到特定位置,极大提升文件上传、下载和搜索效率。例如,在大型文件共享平台中,文件名等信息作为键,物理地址作为值存入哈希表,用户检索时快速定位文件,减少遍历时间。此外,哈希表还用于文件一致性校验,确保传输文件未被篡改。以Python代码示例展示基于哈希表的文件索引实现,模拟文件共享服务的文件索引构建与检索功能。哈希表及其分布式变体如一致性哈希算法,保障文件均匀分布和负载均衡,持续优化文件共享服务性能。
|
24天前
|
公司电脑网络监控场景下 Python 广度优先搜索算法的深度剖析
在数字化办公时代,公司电脑网络监控至关重要。广度优先搜索(BFS)算法在构建网络拓扑、检测安全威胁和优化资源分配方面发挥重要作用。通过Python代码示例展示其应用流程,助力企业提升网络安全与效率。未来,更多创新算法将融入该领域,保障企业数字化发展。
42 10
|
25天前
|
基于 Python 广度优先搜索算法的监控局域网电脑研究
随着局域网规模扩大,企业对高效监控计算机的需求增加。广度优先搜索(BFS)算法凭借其层次化遍历特性,在Python中可用于实现局域网内的计算机设备信息收集、网络连接状态监测及安全漏洞扫描,确保网络安全与稳定运行。通过合理选择数据结构与算法,BFS显著提升了监控效能,助力企业实现智能化的网络管理。
28 7
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
63 12
基于 Python 的布隆过滤器算法在内网行为管理中的应用探究
在复杂多变的网络环境中,内网行为管理至关重要。本文介绍布隆过滤器(Bloom Filter),一种高效的空间节省型概率数据结构,用于判断元素是否存在于集合中。通过多个哈希函数映射到位数组,实现快速访问控制。Python代码示例展示了如何构建和使用布隆过滤器,有效提升企业内网安全性和资源管理效率。
53 9