鸽巢原理:揭秘计数排序的奇妙思想

简介: 鸽巢原理:揭秘计数排序的奇妙思想

一、计数排序的概念

计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。以前我们选择排序的时候一般都是使用大数比较小数来进行比较

而计数排序是统计每个数字出现的个数来进行排序,哈哈哈是不是突然就发现了新大陆这个思想太奇妙了,非常值得我们学习一下他的思想

其计数排序的思想就是把每个当某个数字出现时就在其下标下面 ++ 如果没有这个数字的话就默认为零。

诶是不是非常简单要对一组数据进行排序的话我们顶多遍历三遍就可以了

  • 第一遍找到最大值进行开空间
  • 第二遍进行统计个数
  • 第三遍根据统计好的个数来直接写入

1.1 计数排序的缺陷

但是这样的话就有一个非常大的缺陷就是我们的数据多大就要开多少空间这样空间浪费的实在的是太大了:

  1. 空间开辟太大了,数值多大就得开辟多少空间
  2. 既然是使用下标进行统计排序那么肯定只能排序整数

1.2 计数排序的优化

所以我们先找出需要排序的最大值和最小值,把他们的差值标记住用于开辟空间:

当我们开空间时就只开他们差值个空间就可以了

  • 当需要统计个数的时候就把原本的数减去 最小值 来存放下标
  • 而恢复排序的时候只需要将下标加上 最小值 就可以了

这样一来性能就得到了极大的优化

二、计数排序的实现

2.1 计数排序的代码

//计数排序
void CountSort(int* a, int n)
{
  int max = 0, min = 0;
  for (int i = 0; i < n; i++)
  {
    if (a[i] > max)
    {
      max = a[i];
    }
    if (a[i] < min)
    {
      min = a[i];
    }
  }
  //开辟计数空间
  int range = max - min + 1;
  int* tmp = (int*)calloc(range,sizeof(int));
  if (tmp == NULL)
  {
    perror("calloc file");
    exit(-1);
  }
  //统计数据出现的个数
  for (int i = 0; i < n; i++)
  {
    tmp[a[i]-min]++;
  }
  //排序
  int index = 0;
  for (int i = 0; i < range; i++)
  {
    while (tmp[i])
    {
      a[index++] = i+min;
      tmp[i]--;
    }
  }
}

2.2 计数排序的惊人性能

前面我们一直在说计数排序性能好多少多少现在我们就来和快排希尔排序堆排序归并排序这些经典高性能对手来比比:

🔥 注:本次我们采用10万个随机数来进行排序,为避免随机数重复所以都加 i 。

实际性能

这里可以看到计数排序完胜,排10万个数据只需要一毫秒

  • 🔥 接下来我们看看1000万个数

这里依旧是完爆各种排序哦豁是不是,拳踢快排老师傅,脚打归并小年轻。

三、计数排序的特性总结

  1. 计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
  2. 时间复杂度:O(MAX(N,范围))
  3. 空间复杂度:O(范围)
  4. 稳定性:稳定

这里需要注意的是 计数排序只适合,在一个特定范围内数据特别多的情况或者范围集中都数据性能绝对是最棒的!

🔥 注:计数排序还有一个遗憾由于是使用下标统计来排序所以只能排序整形。

目录
相关文章
|
8月前
|
大数据 物联网 云计算
课时24:案例分享——中国邮政
在国企改革背景下,中国邮政积极推进行业信息化转型。通过与阿里云合作,中国邮政实现了核心业务云化,解决了高并发、资源不均衡等问题,并构建了PB级大数据平台,推动智能化分拣和寄递业务自动化。石崇斌总经理分享了邮政信息化发展历程及未来规划,强调以用户为中心的理念和技术应用的重要性。
264 1
课时24:案例分享——中国邮政
|
分布式计算 关系型数据库 MySQL
使用 PySpark 读取csv数据进行分析,将结果数据导入招聘数据
使用 PySpark 读取csv数据进行分析,将结果数据导入招聘数据
276 2
|
11月前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
329 3
|
10月前
|
人工智能 API 开发者
阿里CEO吴泳铭-2024互联网大会发言:AI的最大价值是推动生产力变革
11月21日,2024年世界互联网大会“互联网企业家论坛”在乌镇召开。阿里巴巴CEO吴泳铭表示,AI的最大价值在于推动各行各业的生产力变革,而非仅限于开发超级APP。他强调,发展AI需建设繁荣的技术、产品和市场生态。目前,30多万家企业已接入阿里“通义”大模型,应用于代码开发、药物研发等场景。阿里巴巴坚持开源路线,全球开发者基于“通义千问”开发的衍生模型已突破7.8万个。吴泳铭认为,AI的发展需要行业共同努力,建设繁荣生态以实现高质量持续发展。
|
监控 负载均衡 安全
Elasticsearch集群配置优化
Elasticsearch集群配置优化
268 1
|
Java 测试技术 编译器
🎯Java零基础-Switch条件语句详解 🎯
【10月更文挑战第8天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
256 6
|
缓存 NoSQL Redis
一天五道Java面试题----第九天(简述MySQL中索引类型对数据库的性能的影响--------->缓存雪崩、缓存穿透、缓存击穿)
这篇文章是关于Java面试中可能会遇到的五个问题,包括MySQL索引类型及其对数据库性能的影响、Redis的RDB和AOF持久化机制、Redis的过期键删除策略、Redis的单线程模型为何高效,以及缓存雪崩、缓存穿透和缓存击穿的概念及其解决方案。
|
存储 Kubernetes API
在K8S中,各个组件及其作用是什么呢?
在K8S中,各个组件及其作用是什么呢?
|
网络架构
定义vue-router的动态路由以及如何获取传过来的动态参数
定义vue-router的动态路由以及如何获取传过来的动态参数
512 1
|
JavaScript 小程序 Java
基于Java的大学生汉服租赁网站的设计与实现(亮点:在线支付、ECharts图表展示、完整下单流程、视频点播、点赞评论互动)
基于Java的大学生汉服租赁网站的设计与实现(亮点:在线支付、ECharts图表展示、完整下单流程、视频点播、点赞评论互动)
284 0