【数据结构】优先级队列(堆)从实现到应用详解

简介: 本文介绍了优先级队列的概念及其底层数据结构——堆。优先级队列根据元素的优先级而非插入顺序进行出队操作。JDK1.8中的`PriorityQueue`使用堆实现,堆分为大根堆和小根堆。大根堆中每个节点的值都不小于其子节点的值,小根堆则相反。文章详细讲解了如何通过数组模拟实现堆,并提供了创建、插入、删除以及获取堆顶元素的具体步骤。此外,还介绍了堆排序及解决Top K问题的应用,并展示了Java中`PriorityQueue`的基本用法和注意事项。

🍁1. 优先级队列的概念

在之前已经了解过,队列是一种先进先出的数据结构,而优先级队列是一种抽象数据类型,其中每个元素都有一个优先级。与标准的队列不同,优先级队列中元素的顺序是根据其优先级来决定的,而不是按插入的顺序,优先级高的元素将优先出队。

JDK1.8中的PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整。

🍁2. 堆的介绍

堆是一种特殊的完全二叉树结构,堆又可以分为大根堆和小根堆

大根堆:每个节点的值都大于或等于其子节点的值,也就是根节点是树中的最大值。

小根堆:每个节点的值都小于或等于其子节点的值,也就是根节点包含树中的最小值。

🍁3. 堆的模拟实现

底层通过数组来实现堆

public class MyHeap {
    public int[] elem;
    public int usedSize;
    public MyHeap(int[] elem) {
        this.elem = elem;
    }
}

将元素存储在数组中后,如果孩子节点的下标为i,那么双亲节点的下标为(i - 1)/ 2

如果双亲节点的下标为 i ,那么左孩子的下标为 2*i+1,右孩子的下标为 2*i+2,如果左孩子或右孩子下标越界了就表示没有左孩子或右孩子

明白了节点怎么表示后就可以根据这些关系进行建堆了,

从最后一棵子树开始,依次往上调用向下调整

public void createHeap() {
    //最后一棵子树
    for (int parent = (usedSize - 1 - 1) / 2; parent >= 0; parent--) {
        siftDown(parent, this.usedSize);
    }
}

🍁3.1 向下调整建堆

向上调整通常指的是在插入新元素到堆中后,为了确保堆的性质(父节点的值总是大于或等于(最大堆)或小于或等于(最小堆)其子节点的值),对堆进行调整

以大根堆的创建为例:

通过双亲节点计算出左孩子节点的下标,如果左孩子存在,就继续判断右孩子是否存在,如果右孩子也存在并且右孩子大于左孩子,就把child的位置更新为右孩子,接着和双亲节点进行比较,如果比双亲节点大,就交换,以此循环调整

private void siftDown(int parent, int usedSize) {
    int child = parent * 2 + 1;
    while (child < usedSize) {
        //右孩子大于左孩子的情况,更新孩子节点
        if (child + 1 < usedSize && elem[child] < elem[child + 1]) {
            child++;
        }
        if (elem[child] > elem[parent]) {
            int tmp = elem[parent];
            elem[parent] = elem[child];
            elem[child] = tmp;
            //往下更新双亲节点和孩子节点
            parent = child;
            child = child * 2 + 1;
        } else {
            break;
        }
    }
}

这个时间复杂度通过推导得出是一个O(n)的

🍁3.2 向上调整

给出一个孩子节点,再求出双亲节点,接着比较双亲节点和孩子节点,进行调整,这里的结束条件是双亲节点小于或等于0,意味着此时已经调整到了堆顶

还是以大根堆为例,由于大根堆要求的是双亲节点要大于孩子节点,所以无论是左孩子还是右孩子比双亲节点大,都需要交换,所以这里就不用区分左孩子还是右孩子了,都按照左孩子节点进行

private void siftUp(int child){
int parent = (child - 1) / 2;
while(parent >= 0){
    if(elem[child] > elem[parent]){
        int tmp = elem[child];
        elem[child] = elem[parent];
        elem[parent] = tmp;
        child = parent;
        parent = (child - 1) / 2;
    }else{
        break;
    }
}
}

向上调整的方法由于比向下调整多了最后一层的操作,所以时间复杂度为O(n + logn)

🍁3.3  插入

插入的思路就是先把元素放在最后,接着调用向上调整,依次把要插入的元素调整到适合的位置

public void offer(int val){
if(isFull()){
    elem = Arrays.copyOf(elem,2*elem.length);
}
elem[usedSize] = val;
//调用向上调整
siftUp(usedSize);
usedSize++;
}
public boolean isFull(){
    return usedSize == elem.length;
}

🍁3.4 删除

思路:把根节点和最后一个节点交换,接着把usedSize--,这样就达到了删除的效果,并且此时只有根节点不满足大根堆的条件,只需要再次调用向下调整,就符合了大根堆

public int poll(){
    if(isEmpty()){
        throw new QueueEmptyException("队列为空");
    }
    int val = elem[0];
    //把根节点元素交换到末尾
    swap(elem,0,usedSize-1);
    siftDown(0,usedSize-1);
    //usedSize--就表示已经删除了
    usedSize--;
    return val;
}

🍁3.5 获取堆顶元素

直接对堆顶元素进行返回即可

public int peek(){
    if(isEmpty()){
        throw new QueueEmptyException("队列为空");
    }
    return elem[0];
}

🍁4. 堆的应用

🍁4.1 堆排序

将一组数据从小到大进行排序,使用到的是大根堆,大根堆的根节点肯定是最大的,然后把根节点和末尾元素交换,接着进行向下调整,然后新的根节点再和倒数第二个元素交换,以此类推,最终就可以实现从小到大排序的效果

public void heapSort(){
    int end = usedSize - 1;
    while(end > 0){
        swap(elem,0,end);//交换
        siftDown(0,end);//调整
        end--;//更新
    }
}

堆排序的时间复杂度是nlogn,如果加上创建堆,就是n + nlogn,依旧是nlogn

🍁4.2 top k 问题

topk 问题指的是求出数据集合中前k个最大或最小的元素

例如求出前k个最小的元素,会有以下几种方法:

1.整体进行排序,取出前k个元素

2.创建小根堆,拿出k个堆顶元素

3.把前k个元素创建为大根堆,遍历剩下的N-k个元素,和堆顶元素比较,如果比堆顶元素小,就删除堆顶元素,当前元素入堆,遍历完成后小根堆中的k个元素即为所求

第三种方法,当k很小时时间复杂度就趋近于o(n),是比前面的两种高效的

来看一道力扣上的面试题:

面试题 17.14. 最小K个数

class IntCmp implements Comparator<Integer>{
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);
    }
}
class Solution {
    public int[] smallestK(int[] arr, int k) {
        int[] res = new int[k];
        if(arr == null || k == 0){
            return res;
        }
        PriorityQueue<Integer> queue = new PriorityQueue<>(k, new IntCmp());
        for (int i = 0; i < k; i++) {
            queue.offer(arr[i]);
        }
        for (int i = k; i < arr.length; i++) {
            if (arr[i] < queue.peek()) {
                queue.poll();
                queue.offer(arr[i]);
            }
        }
        for (int i = k - 1; i >= 0; i--) {
            res[i] = queue.poll();
        }
        return res;
    }
}

🍁5. Java中PriorityQueue的使用

使用PriorityQueue时需要注意:

1. 放置的元素必须能够比较大小,不能插入无法比较大小的对象,否则会抛出异常

2. 不能插入null对象,否则会空指针异常

3. 插入和删除的时间复杂度为O(log ₂ n)

4. 默认情况下是小根堆

我们来演示一下这些构造方法

public class PriorityQueueDemo {
    public static void main(String[] args) {
        //创建一个默认容量的优先级队列
        PriorityQueue<Integer> queue1 = new PriorityQueue<>();
        //创建一个100容量的优先级队列
        PriorityQueue<Integer> queue2 = new PriorityQueue<>(100);
        //传入ArrayList对象创建对象
        ArrayList<Integer> arrayList = new ArrayList<>();
        arrayList.add(3);
        arrayList.add(1);
        arrayList.add(2);
        PriorityQueue<Integer> queue3 = new PriorityQueue<>(arrayList);
        System.out.println(queue3);
    }
}

很明显,最终的结果也是一个小根堆的形式,如果想要创建大根堆需要传入相应的比较器

class IntCmp implements Comparator<Integer>{
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);//Integer类型不能用 "-" 比较
    }
}
public class PriorityQueueDemo {
    public static void main(String[] args) {
        //传入比较器对象     
        PriorityQueue<Integer> queue4 = new PriorityQueue<>(new IntCmp());
        queue4.add(3);
        queue4.add(1);
        queue4.add(2);
        System.out.println(queue4);
    }
}

此外,其他的方法和上面实现的一样

相关文章
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
186 9
|
1月前
|
存储 算法 Java
散列表的数据结构以及对象在JVM堆中的存储过程
本文介绍了散列表的基本概念及其在JVM中的应用,详细讲解了散列表的结构、对象存储过程、Hashtable的扩容机制及与HashMap的区别。通过实例和图解,帮助读者理解散列表的工作原理和优化策略。
39 1
散列表的数据结构以及对象在JVM堆中的存储过程
|
2月前
|
存储 Java
Java中的HashMap和TreeMap,通过具体示例展示了它们在处理复杂数据结构问题时的应用。
【10月更文挑战第19天】本文详细介绍了Java中的HashMap和TreeMap,通过具体示例展示了它们在处理复杂数据结构问题时的应用。HashMap以其高效的插入、查找和删除操作著称,而TreeMap则擅长于保持元素的自然排序或自定义排序,两者各具优势,适用于不同的开发场景。
50 1
|
23天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
44 5
|
22天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
52 1
|
1月前
|
缓存 NoSQL PHP
Redis作为PHP缓存解决方案的优势、实现方式及注意事项。Redis凭借其高性能、丰富的数据结构、数据持久化和分布式支持等特点,在提升应用响应速度和处理能力方面表现突出
本文深入探讨了Redis作为PHP缓存解决方案的优势、实现方式及注意事项。Redis凭借其高性能、丰富的数据结构、数据持久化和分布式支持等特点,在提升应用响应速度和处理能力方面表现突出。文章还介绍了Redis在页面缓存、数据缓存和会话缓存等应用场景中的使用,并强调了缓存数据一致性、过期时间设置、容量控制和安全问题的重要性。
40 5
|
1月前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
76 16
|
2月前
|
机器学习/深度学习 存储 人工智能
数据结构在实际开发中的广泛应用
【10月更文挑战第20天】数据结构是软件开发的基础,它们贯穿于各种应用场景中,为解决实际问题提供了有力的支持。不同的数据结构具有不同的特点和优势,开发者需要根据具体需求选择合适的数据结构,以实现高效、可靠的程序设计。
114 7
|
1月前
|
算法 安全 NoSQL
2024重生之回溯数据结构与算法系列学习之栈和队列精题汇总(10)【无论是王道考研人还是IKUN都能包会的;不然别给我家鸽鸽丢脸好嘛?】
数据结构王道第3章之IKUN和I原达人之数据结构与算法系列学习栈与队列精题详解、数据结构、C++、排序算法、java、动态规划你个小黑子;这都学不会;能不能不要给我家鸽鸽丢脸啊~除了会黑我家鸽鸽还会干嘛?!!!
|
1月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
32 1