“计数”排序

简介: “计数”排序

一、什么是计数排序?


计数排序,是通过统计每一个数字出现的次数,并把它映射到与它自己本身数值相同的下标处,再遍历映射的数组使原数组有序的一种排序方法,计数排序的本质是一种哈希算法,也就是通过建立映射关系来达到排序的目的。


二、如何实现计数排序?


基本思路:先开辟一个映射数组,然后遍历原数组,数组中的元素是几就在开辟的的映射数组下标为几的位置+1。得到的这个映射数组就包含了原数组中所有元素的映射关系。遍历一遍映射数组找出原数组中出现过的数即可。


演示图如下:




观察可以知道,映射数组中每个位置对应的值代表这个下标的值在原数组中出现了多少次,那么我们看上图可以知道2出现了3次,3出现了1次,5出现看2次,6出现了1次,8出现了1次,其它出现了0次。那么我们遍历一遍映射数组并把对应的值放回到原数组就完成了排序了。


但是这里面临着一个问题,那就是我们开辟的数组到底要开多大的空间呢?显然,我们在上述例子中开辟了10个整形空间的数组,但是可以看到,有5个位置都是空的,也就是说有五个位置的数都是没出现过的,这样子开辟空间显然是有些浪费了,我们上面的写法是一种绝对映射的写法,绝对映射就是这个数本身是多少就映射到下标为多少的位置,但是如果我给出以下这个数组让你排序呢?



显然,以上数字的最大值是109,也就是说如果用绝对映射的方法那我们至少需要开110个空间,因为109要映射到下标为109的位置,下标从0开始,0-109就是110个数。但是仔细观察你会发现,这些数都是在100-109之间的,换句话说如果你开辟110个空间,那么前100个位置都是0,没有数映射,所以就等于是白白浪费了100个整形的空间,这显然是不能接受的,所以有人就想出来了一种相对映射的方法,我的100映射到0的位置,我的109映射到9的位置,其它的也以此类推,每个数在映射的时候都减去100,等到取出数据的时候在加上100就能得到原来的数了。这样一来,我们需要开10个整形的空间就可以了,大大减少了内存的消耗。


那我们应该开多大的空间呢?


开辟的空间的大小=最大元素-最小元素+1

例如上面的例子就是:开辟空间的大小=109-100+1=10

为什么要+1?因为数组下标是从0开始的,如果不+1,那就是开辟9个空间,那么109就没法映射到109-100=9的位置了。


参考代码如下:


void CountSort(int* a, int n)
{
  assert(a);
  int i = 0;
  int max = a[0];
  int min = a[0];
  //找出最大最小值,算出需要开辟多大的空间
  for (i = 1; i < n; i++)
  {
    if (a[i] > max)
    {
      max = a[i];
    }
    if (a[i] < min)
    {
      min = a[i];
    }
  }
  //需要开辟的空间的大小range
  int range = max - min + 1;
  int* CountArr = (int*)malloc(sizeof(int) * range);
  if (CountArr == NULL)
  {
    perror(" ");
    return;
  }
  //一定要先初始化为0,不然的话是随机数就会影响统计的结果
  memset(CountArr, 0, sizeof(int) * range);
  //遍历数组,给映射数组对应的位置统计数组出现的次数
  for (i = 0; i < n; i++)
  {
    //减去min是它的相对映射的位置
    CountArr[a[i] - min]++;
  }
  //遍历映射数组
  int j = 0;
  for (i = 0; i < range; i++)
  {
    //对应的位置是几就把这个数字往原数组中填几次
    while (CountArr[i]--)
    {
      //由于上面在映射的时候减去了min,所以在重新
      //写回数组的时候需要加上min得到原来的值
      a[j++] = i + min;
    }
  }
  free(CountArr);
  CountArr = NULL;
}


三、适用场景


尽管相对映射能处理一些相对集中的元素的排序的问题,但也只是解决了相对较为集中的元素的排序的问题,如果一个数组的数是很分散的,例如:1,100,102,104,那这个相对映射方法依然没办法很好地减少内存的消耗,所以计数排序是具有局限性的,只适合元素相对较为集中的数组的排序,而且只能排整数,不能排其他类型的数据,如浮点数等等。因为下标只能是整数。对于相对映射是可以对负数进行排序的,因为无论如何最小的那个元素都是映射到0的位置的,不会越界,但是绝对映射不能对负数排序,不然的话下标访问负数就一定会越界访问的。所以计数排序的使用场景还是很局限的。


四、时间复杂度和空间复杂度


毫无疑问,时间复杂度是O(N)就能解决问题的,因为只遍历了两次数组。空间复杂度是O(range),如果N(元素个数)远远大于range,那么可以认为是O(1)的,如果N和range是同一数量级的,那么是O(N),如果range远远大于N,那么是O(range)。

在适当的场景下,计数排序的时间复杂度比其它的所有排序的时间复杂度都要低,可以认为是O(N)的,但是由于有很大的局限性,所以在很多地方都不适用。计数排序也就得不到推广。


相关文章
|
机器学习/深度学习 自然语言处理 算法
Transformer 模型:入门详解(1)
动动发财的小手,点个赞吧!
13850 1
Transformer 模型:入门详解(1)
|
4月前
|
UED
网络性能指标
本内容详细介绍了网络性能中的三个关键指标:时延、抖动和丢包率。时延指数据传输所需时间,影响实时性;抖动表示延迟变化程度,反映网络稳定性;丢包率衡量数据丢失比例,评估传输可靠性。这些指标对在线游戏、视频会议等实时应用至关重要,高时延、大抖动或高丢包率会显著降低用户体验。通过类比快递寄送和语音通话,清晰解释了各指标的定义及应用场景。
470 8
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
ICLR 2025 | EDiT:一种基于 Local SGD 策略的大模型高效分布式训练方法
蚂蚁 AI Infra 团队在深度学习最核心之一的训练框架方向上持续投入与创新,实现了提升资源利用率、加速训练、提升训练稳定性等目标。我们提出的 EDiT 方法,即为其中一项工作。
|
人工智能 NoSQL atlas
生成式AI入门必读:基本概念、数据挑战与解决方案
许多企业正在选择MongoDB Atlas。其原生向量搜索功能,加上统一的 API 和灵活的文档模型,对于寻求通过 RAG 方法提取专有数据来增强 LLM 的企业来说,是一个有吸引力的选择。
3801 4
|
存储 分布式计算 Hadoop
分布式计算框架在大规模数据处理中的应用
【8月更文第18天】随着大数据时代的到来,对海量数据进行有效的存储、处理和分析变得越来越重要。传统的单机系统已经无法满足PB级别数据集的需求。分布式计算框架,如Apache Hadoop和Apache Spark,成为了处理这些大规模数据集的重要工具。
936 0
|
11月前
|
并行计算 Ubuntu 开发工具
Jetson学习笔记(一):jetson 系列镜像下载、烧写、设置散热风扇、中文包、pip、中转英目录、软件源、显示CSI摄像头
关于NVIDIA Jetson系列设备的入门学习笔记,涵盖了从下载镜像、烧录、设置散热风扇、安装中文语言包、配置环境变量、安装CUDA和OpenCV,到显示CSI摄像头和增加Swap交换空间的详细步骤。
754 0
Jetson学习笔记(一):jetson 系列镜像下载、烧写、设置散热风扇、中文包、pip、中转英目录、软件源、显示CSI摄像头
|
11月前
|
存储 搜索推荐 C语言
如何理解指针作为函数参数的输入和输出特性
指针作为函数参数时,可以实现输入和输出的双重功能。通过指针传递变量的地址,函数可以修改外部变量的值,实现输出;同时,指针本身也可以作为输入,传递初始值或状态。这种方式提高了函数的灵活性和效率。
|
10月前
|
自然语言处理
3500机械保护系统Bently 3500/14检测模块
本特利3500系列机械保护系统,配以BENTLY_MANUALS DVD,提供多语言手册与数据表,涵盖安装、操作、维护指导及规格订购信息。3500/53模块专为机械超速检测设计,具备高可靠性、易集成和热插拔功能,确保在恶劣环境下的稳定运行,是机械保护的理想选择。
114 0
|
11月前
|
缓存 负载均衡 算法
nginx学习:配置文件详解,负载均衡三种算法学习,上接nginx实操篇
Nginx 是一款高性能的 HTTP 和反向代理服务器,也是一个通用的 TCP/UDP 代理服务器,以及一个邮件代理服务器和通用的 HTTP 缓存服务器。
556 0
nginx学习:配置文件详解,负载均衡三种算法学习,上接nginx实操篇
|
SQL 缓存 API
SqlAlchemy 2.0 中文文档(二十八)(4)
SqlAlchemy 2.0 中文文档(二十八)
367 1