掌握优先级队列:提升效率的关键技巧

简介: 掌握优先级队列:提升效率的关键技巧


优先级队列的概念

队列是一种先进先出的数据结构,但在一些情况下我们要优先处理一些情况,比如:正在手机上打游戏的时候,如果有来电,那么系统就应该处理打进来的电话。

在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。

优先级队列的模拟实现

DK1.8中的PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整。因此我们先来模拟堆的创建,插入与删除。

堆的创建

堆的创建代码:

//找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点就使用向下调整
    public  void  creatHeap(int[] arr){
    int root = (arr.length-2)/2;
        for (; root>=0 ; root--) {
            shiftDown(arr,root);
        }
    }

建堆的时间复杂度为O(N)

堆的向下调整代码(以创建大堆代码为例):

public void shiftDown(int[] arr, int parent){
        // child先标记parent的左孩子,因为parent可能右左没有右
    int child = parent*2+1;
    int size = arr.length;
    while (child < size){
        // 如果右孩子存在,找到左右孩子中较大的孩子,用child进行标记
        if(child+1 < size && arr[child] < arr[child+1]){
            child++;
        }
        // 如果双亲比其最大的孩子还小,则交换
        if(arr[child]>parent){
            int temp = arr[child];
            arr[child] = arr[parent];
            arr[parent] = temp;
        }else {
            break;
        }
        parent = child;
        child = (parent*2)+1;
    }
    }

堆的插入与删除

堆的插入

堆的插入总共需要两个步骤:

  1. 先将元素放入到底层空间中(注意:空间不够时需要扩容)
  2. 将最后新插入的节点向上调整,直到满足堆的性质
public void push(int val) {
      if(isFull()){
          return;
      }
      //usedSize为堆中元素个数
      elem[usedSize]=val;
      usedSize++;
      shiftUp(usedSize-1);
    }

向上调整:

private void shiftUp(int child){
        // 找到child的双亲
        int parent = (child-1)/2;
        while (parent >= 0){
            if(arr[parent]>=arr[child]){
                break;
            }else {
                // 将双亲与孩子节点进行交换
                int temp = arr[parent];
                arr[parent] = arr[child];
                arr[child] = temp;
                child = parent;
                parent = (child-1)/2;
            }
        }
    }

堆的删除

堆的删除一定删除的是堆顶元素。具体如下:

  1. 将堆顶元素对堆中最后一个元素交换
  2. 将堆中有效数据个数减少一个
  3. 对堆顶元素进行向下调整
public void pollHeap() {
        if(isEmpty()){
            return;
        }
        elem[0] = elem[usedSize-1];
        usedSize--;
        shiftDown(0,usedSize);
    }

用堆模拟实现优先级队列

public class MyPriorityQueue { 
 private int[] array = new int[100];   
 private int size = 0;
 //入队
 public void offer(int e) {
 array[size++] = e;
 //向上调整
 shiftUp(size - 1);
 }
 //出队
 public int poll() {
 int oldValue = array[0];
 array[0] = array[--size];
 //向下调整
 shiftDown(0);
 return oldValue;
 }
 //出堆首元素
 public int peek() {
 return array[0];
 }
 }

常见接口了解

Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的。

关于PriorityQueue的使用要注意:

  1. 使用时必须导入PriorityQueue所在的包
  2. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出ClassCastException异常
  3. 不能插入null对象,否则会抛出NullPointerException
  4. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
  5. 插入和删除元素的时间复杂度为O(logN)
  6. PriorityQueue底层使用了堆数据结构
  7. PriorityQueue默认情况下是小堆-即每次获取到的元素都是最小的元素

PriorityQueue的几种常见构造方法

构造器 功能介绍
PriorityQueue() 创建一个空的优先级队列,默认容量是11
PriorityQueue(int initialCapacity) 创建一个初始容量为initialCapacity的优先级队列,注意:initialCapacity不能小于1,否则会抛IllegalArgumentException异常
PriorityQueue(Collection<? extends E> c) 用一个集合来创建优先级队列

我们可以使用优先级队列解决一些问题,例如TOPK问题:最大或者最小的前k个数据。

思路就是我们求最大的前k个数据,我们用数据的前k个数字建一个小堆,然后依次拿堆顶元素与剩下的数据进行比较,如果那个数据大于堆定元素就进行互换,直到遍历完剩下的数据,堆中k个数据就为最大的k个数据。堆顶元素就为第k大元素。

总结思路就是:

  1. 用数据集合中前K个元素来建堆
    前k个最大的元素,则建小堆
    前k个最小的元素,则建大堆
  2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
    将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
相关文章
|
Linux Shell
Linux 进程的前台/后台切换
当你用shell启动一个程序时,往往他是在前台工作的。程序会一直占用终端命令行,例如你在前台解压的时候必须等着,期间干不了别的事(除非另开一个终端)。 例如经常用连接到远程服务器执行脚本的时候,如果本地网络中断后,这个时候前台进程就结束了,比较的懊恼,必须重新执行。
426 6
|
存储 人工智能 数据管理
【云故事探索】基于阿里云助力地理产业2.0落地,实现遥感数据智能化管理
中国某遥感数据服务中心借助阿里云ECS、GPU和OSS服务,成功实现了地理信息产业升级。此前,中心面临数据管理混乱、服务响应慢等问题。通过阿里云的解决方案,构建了全生命周期管理的遥感数据平台,强化了自动化、智能化的数据生产能力,提升了数据服务的准确性和及时性。此外,平台还增强了数据共享,扩大了应用范围。未来,中心计划结合AI技术,探索地理信息3.0时代,利用阿里云的人工智能平台进一步提升数据管理和应用能力。
756 1
|
Android开发 Python
uiautomator2:python控制手机的神器
uiautomator2:python控制手机的神器
415 0
|
存储 安全 C语言
C语言中的共用体与结构体的区别
C语言中的共用体与结构体的区别
435 3
|
机器学习/深度学习 Shell C++
测试本地部署ChatGLM-6B | ChatGPT
ChatGLM-6B是款62亿参数的中英对话模型,类似ChatGPT,可在6GB显存(INT4量化)的GPU或CPU上运行。它提供流畅、多样的对话体验。用户可从Hugging Face或清华云下载模型配置。部署涉及创建Python环境,安装依赖,下载模型到`ckpt`文件夹。测试时加载tokenizer和模型,使用示例代码进行交互。应用包括基于MNN和JittorLLMs的推理实现,以及langchain-ChatGLM、闻达、chatgpt_academic和glm-bot等项目。5月更文挑战第10天
416 1
|
存储 缓存 搜索推荐
深入理解Elasticsearch倒排索引原理与优化策略
总之,Elasticsearch的倒排索引是其高效全文搜索的核心。为了提高性能和可伸缩性,Elasticsearch采用了多种优化策略,包括压缩、分片、合并、位集合和近实时搜索等。这些策略使Elasticsearch成为处理大规模文本数据的强大工具。
1099 0
|
NoSQL Oracle 关系型数据库
cassandra使用场景判断:何时使用及何时不用
介绍 我有一个具有以下功能的数据库服务器: 高可用设计。 可以全球分布。 允许应用程序随时随地写入任何节点。 只需向群集添加更多节点即可进行线性扩展。 自动负载及数据均衡。 一种看起来很像SQL的查询语言。
9382 1
|
传感器 调度 芯片
【玩转RT-Thread】线程管理(详细原理)(上)
【玩转RT-Thread】线程管理(详细原理)(上)
537 0
|
算法
【MATLAB】 HANTS滤波算法
【MATLAB】 HANTS滤波算法
402 0