Python算法——基数排序

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: Python算法——基数排序

基数排序(Radix Sort)是一种非比较性排序算法,适用于对整数或字符串等数据进行排序。它根据数据的位数进行排序,从低位到高位或从高位到低位,通过分配数据到不同的桶中,然后按顺序合并这些桶,得到有序数组。基数排序是一种稳定的排序算法,适用于整数或字符串排序。本文将详细介绍基数排序的工作原理和Python实现。

基数排序的工作原理

基数排序的基本思想是:

  1. 根据数据的位数,从低位到高位或从高位到低位,依次对数据进行排序。
  2. 每一轮排序根据位数的不同,将数据分配到不同的桶中。
  3. 按照桶的顺序合并所有的桶,得到有序数组。
    基数排序的关键在于如何确定位数的顺序,如何将数据分配到桶中以及如何对桶中的数据进行合并。通常情况下,基数排序是通过分别处理每个位上的数字来排序的,从最低位到最高位,或者反之。

下面是一个示例,演示基数排序的过程:

原始数组:[170, 45, 75, 90, 802, 24, 2, 66]

  1. 从最低位(个位)开始,将元素分配到 10 个桶中,根据个位数字的不同。
  • 桶 0:170, 90, 802
  • 桶 2:2, 802
  • 桶 4:24
  • 桶 5:75
  • 桶 6:66
  • 桶 7:
  • 桶 8:
  • 桶 9:45
  1. 合并所有的桶,得到有序数组:[170, 90, 802, 2, 24, 75, 66, 45]

    Python实现基数排序

    下面是Python中的基数排序实现:
def radix_sort(arr):
    # 获取数组中的最大值
    max_val = max(arr)

    # 计算最大值的位数
    digit_count = len(str(max_val))

    for digit in range(digit_count):
        # 创建 10 个桶
        buckets = [[] for _ in range(10)]

        # 将元素分配到桶中
        for num in arr:
            digit_val = (num // (10 ** digit)) % 10
            buckets[digit_val].append(num)

        # 合并所有的桶
        arr = []
        for bucket in buckets:
            arr.extend(bucket)

    return arr
  • arr 是待排序的整数数组。
  • max_val 是数组中的最大值,用于计算位数。
  • 计算最大值的位数。
  • 创建 10 个桶用于分配数据。
  • 将元素分配到对应的桶中,根据位数的不同。
  • 合并所有的桶,得到有序数组。

    示例代码

    下面是一个使用Python进行基数排序的示例代码:
def radix_sort(arr):
    max_val = max(arr)
    digit_count = len(str(max_val))

    for digit in range(digit_count):
        buckets = [[] for _ in range(10)]

        for num in arr:
            digit_val = (num // (10 ** digit)) % 10
            buckets[digit_val].append(num)

        arr = []
        for bucket in buckets:
            arr.extend(bucket)

    return arr

# 测试排序
arr = [170, 45, 75, 90, 802, 24, 2, 66]
sorted_arr = radix_sort(arr)
print("排序后的数组:", sorted_arr)

时间复杂度

基数排序的时间复杂度为 O(nk),其中 n 是数组的长度,k 是最大值的位数。基数排序是一种非比较性排序算法,适用于整数或字符串排序。

总之,基数排序是一种高效的非比较性排序算法,通过分别处理每个位上的数字来排序,从最低位到最高位,或者反之,实现了对整数或字符串数组的排序。了解基数排序有助于理解非比较性排序算法的思想,提供了一种适用于特定场景的排序解决方案。

目录
相关文章
|
12天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
153 55
|
28天前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
127 67
|
28天前
|
存储 搜索推荐 Python
用 Python 实现快速排序算法。
快速排序的平均时间复杂度为$O(nlogn)$,空间复杂度为$O(logn)$。它在大多数情况下表现良好,但在某些特殊情况下可能会退化为最坏情况,时间复杂度为$O(n^2)$。你可以根据实际需求对代码进行调整和修改,或者尝试使用其他优化策略来提高快速排序的性能
120 61
|
29天前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
107 63
|
22天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
122 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
4天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
44 20
|
2天前
|
存储 算法 Python
文件管理系统中基于 Python 语言的二叉树查找算法探秘
在数字化时代,文件管理系统至关重要。本文探讨了二叉树查找算法在文件管理中的应用,并通过Python代码展示了其实现过程。二叉树是一种非线性数据结构,每个节点最多有两个子节点。通过文件名的字典序构建和查找二叉树,能高效地管理和检索文件。相较于顺序查找,二叉树查找每次比较可排除一半子树,极大提升了查找效率,尤其适用于海量文件管理。Python代码示例包括定义节点类、插入和查找函数,展示了如何快速定位目标文件。二叉树查找算法为文件管理系统的优化提供了有效途径。
34 5
|
28天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
28天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2天前
|
存储 缓存 算法
探索企业文件管理软件:Python中的哈希表算法应用
企业文件管理软件依赖哈希表实现高效的数据管理和安全保障。哈希表通过键值映射,提供平均O(1)时间复杂度的快速访问,适用于海量文件处理。在Python中,字典类型基于哈希表实现,可用于管理文件元数据、缓存机制、版本控制及快速搜索等功能,极大提升工作效率和数据安全性。
29 0