【数据结构】优先级队列(堆)从实现到应用详解

简介: 本文介绍了优先级队列的概念及其底层数据结构——堆。优先级队列根据元素的优先级而非插入顺序进行出队操作。JDK1.8中的`PriorityQueue`使用堆实现,堆分为大根堆和小根堆。大根堆中每个节点的值都不小于其子节点的值,小根堆则相反。文章详细讲解了如何通过数组模拟实现堆,并提供了创建、插入、删除以及获取堆顶元素的具体步骤。此外,还介绍了堆排序及解决Top K问题的应用,并展示了Java中`PriorityQueue`的基本用法和注意事项。

🍁1. 优先级队列的概念

在之前已经了解过,队列是一种先进先出的数据结构,而优先级队列是一种抽象数据类型,其中每个元素都有一个优先级。与标准的队列不同,优先级队列中元素的顺序是根据其优先级来决定的,而不是按插入的顺序,优先级高的元素将优先出队。

JDK1.8中的PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整。

🍁2. 堆的介绍

堆是一种特殊的完全二叉树结构,堆又可以分为大根堆和小根堆

大根堆:每个节点的值都大于或等于其子节点的值,也就是根节点是树中的最大值。

小根堆:每个节点的值都小于或等于其子节点的值,也就是根节点包含树中的最小值。

🍁3. 堆的模拟实现

底层通过数组来实现堆

public class MyHeap {
    public int[] elem;
    public int usedSize;
    public MyHeap(int[] elem) {
        this.elem = elem;
    }
}

将元素存储在数组中后,如果孩子节点的下标为i,那么双亲节点的下标为(i - 1)/ 2

如果双亲节点的下标为 i ,那么左孩子的下标为 2*i+1,右孩子的下标为 2*i+2,如果左孩子或右孩子下标越界了就表示没有左孩子或右孩子

明白了节点怎么表示后就可以根据这些关系进行建堆了,

从最后一棵子树开始,依次往上调用向下调整

public void createHeap() {
    //最后一棵子树
    for (int parent = (usedSize - 1 - 1) / 2; parent >= 0; parent--) {
        siftDown(parent, this.usedSize);
    }
}

🍁3.1 向下调整建堆

向上调整通常指的是在插入新元素到堆中后,为了确保堆的性质(父节点的值总是大于或等于(最大堆)或小于或等于(最小堆)其子节点的值),对堆进行调整

以大根堆的创建为例:

通过双亲节点计算出左孩子节点的下标,如果左孩子存在,就继续判断右孩子是否存在,如果右孩子也存在并且右孩子大于左孩子,就把child的位置更新为右孩子,接着和双亲节点进行比较,如果比双亲节点大,就交换,以此循环调整

private void siftDown(int parent, int usedSize) {
    int child = parent * 2 + 1;
    while (child < usedSize) {
        //右孩子大于左孩子的情况,更新孩子节点
        if (child + 1 < usedSize && elem[child] < elem[child + 1]) {
            child++;
        }
        if (elem[child] > elem[parent]) {
            int tmp = elem[parent];
            elem[parent] = elem[child];
            elem[child] = tmp;
            //往下更新双亲节点和孩子节点
            parent = child;
            child = child * 2 + 1;
        } else {
            break;
        }
    }
}

这个时间复杂度通过推导得出是一个O(n)的

🍁3.2 向上调整

给出一个孩子节点,再求出双亲节点,接着比较双亲节点和孩子节点,进行调整,这里的结束条件是双亲节点小于或等于0,意味着此时已经调整到了堆顶

还是以大根堆为例,由于大根堆要求的是双亲节点要大于孩子节点,所以无论是左孩子还是右孩子比双亲节点大,都需要交换,所以这里就不用区分左孩子还是右孩子了,都按照左孩子节点进行

private void siftUp(int child){
int parent = (child - 1) / 2;
while(parent >= 0){
    if(elem[child] > elem[parent]){
        int tmp = elem[child];
        elem[child] = elem[parent];
        elem[parent] = tmp;
        child = parent;
        parent = (child - 1) / 2;
    }else{
        break;
    }
}
}

向上调整的方法由于比向下调整多了最后一层的操作,所以时间复杂度为O(n + logn)

🍁3.3  插入

插入的思路就是先把元素放在最后,接着调用向上调整,依次把要插入的元素调整到适合的位置

public void offer(int val){
if(isFull()){
    elem = Arrays.copyOf(elem,2*elem.length);
}
elem[usedSize] = val;
//调用向上调整
siftUp(usedSize);
usedSize++;
}
public boolean isFull(){
    return usedSize == elem.length;
}

🍁3.4 删除

思路:把根节点和最后一个节点交换,接着把usedSize--,这样就达到了删除的效果,并且此时只有根节点不满足大根堆的条件,只需要再次调用向下调整,就符合了大根堆

public int poll(){
    if(isEmpty()){
        throw new QueueEmptyException("队列为空");
    }
    int val = elem[0];
    //把根节点元素交换到末尾
    swap(elem,0,usedSize-1);
    siftDown(0,usedSize-1);
    //usedSize--就表示已经删除了
    usedSize--;
    return val;
}

🍁3.5 获取堆顶元素

直接对堆顶元素进行返回即可

public int peek(){
    if(isEmpty()){
        throw new QueueEmptyException("队列为空");
    }
    return elem[0];
}

🍁4. 堆的应用

🍁4.1 堆排序

将一组数据从小到大进行排序,使用到的是大根堆,大根堆的根节点肯定是最大的,然后把根节点和末尾元素交换,接着进行向下调整,然后新的根节点再和倒数第二个元素交换,以此类推,最终就可以实现从小到大排序的效果

public void heapSort(){
    int end = usedSize - 1;
    while(end > 0){
        swap(elem,0,end);//交换
        siftDown(0,end);//调整
        end--;//更新
    }
}

堆排序的时间复杂度是nlogn,如果加上创建堆,就是n + nlogn,依旧是nlogn

🍁4.2 top k 问题

topk 问题指的是求出数据集合中前k个最大或最小的元素

例如求出前k个最小的元素,会有以下几种方法:

1.整体进行排序,取出前k个元素

2.创建小根堆,拿出k个堆顶元素

3.把前k个元素创建为大根堆,遍历剩下的N-k个元素,和堆顶元素比较,如果比堆顶元素小,就删除堆顶元素,当前元素入堆,遍历完成后小根堆中的k个元素即为所求

第三种方法,当k很小时时间复杂度就趋近于o(n),是比前面的两种高效的

来看一道力扣上的面试题:

面试题 17.14. 最小K个数

class IntCmp implements Comparator<Integer>{
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);
    }
}
class Solution {
    public int[] smallestK(int[] arr, int k) {
        int[] res = new int[k];
        if(arr == null || k == 0){
            return res;
        }
        PriorityQueue<Integer> queue = new PriorityQueue<>(k, new IntCmp());
        for (int i = 0; i < k; i++) {
            queue.offer(arr[i]);
        }
        for (int i = k; i < arr.length; i++) {
            if (arr[i] < queue.peek()) {
                queue.poll();
                queue.offer(arr[i]);
            }
        }
        for (int i = k - 1; i >= 0; i--) {
            res[i] = queue.poll();
        }
        return res;
    }
}

🍁5. Java中PriorityQueue的使用

使用PriorityQueue时需要注意:

1. 放置的元素必须能够比较大小,不能插入无法比较大小的对象,否则会抛出异常

2. 不能插入null对象,否则会空指针异常

3. 插入和删除的时间复杂度为O(log ₂ n)

4. 默认情况下是小根堆

我们来演示一下这些构造方法

public class PriorityQueueDemo {
    public static void main(String[] args) {
        //创建一个默认容量的优先级队列
        PriorityQueue<Integer> queue1 = new PriorityQueue<>();
        //创建一个100容量的优先级队列
        PriorityQueue<Integer> queue2 = new PriorityQueue<>(100);
        //传入ArrayList对象创建对象
        ArrayList<Integer> arrayList = new ArrayList<>();
        arrayList.add(3);
        arrayList.add(1);
        arrayList.add(2);
        PriorityQueue<Integer> queue3 = new PriorityQueue<>(arrayList);
        System.out.println(queue3);
    }
}

很明显,最终的结果也是一个小根堆的形式,如果想要创建大根堆需要传入相应的比较器

class IntCmp implements Comparator<Integer>{
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2.compareTo(o1);//Integer类型不能用 "-" 比较
    }
}
public class PriorityQueueDemo {
    public static void main(String[] args) {
        //传入比较器对象     
        PriorityQueue<Integer> queue4 = new PriorityQueue<>(new IntCmp());
        queue4.add(3);
        queue4.add(1);
        queue4.add(2);
        System.out.println(queue4);
    }
}

此外,其他的方法和上面实现的一样

相关文章
|
12天前
|
存储 机器学习/深度学习
【数据结构】二叉树全攻略,从实现到应用详解
本文介绍了树形结构及其重要类型——二叉树。树由若干节点组成,具有层次关系。二叉树每个节点最多有两个子树,分为左子树和右子树。文中详细描述了二叉树的不同类型,如完全二叉树、满二叉树、平衡二叉树及搜索二叉树,并阐述了二叉树的基本性质与存储方式。此外,还介绍了二叉树的实现方法,包括节点定义、遍历方式(前序、中序、后序、层序遍历),并提供了多个示例代码,帮助理解二叉树的基本操作。
38 13
【数据结构】二叉树全攻略,从实现到应用详解
|
13天前
|
存储 Java 索引
【数据结构】链表从实现到应用,保姆级攻略
本文详细介绍了链表这一重要数据结构。链表与数组不同,其元素在内存中非连续分布,通过指针连接。Java中链表常用于需动态添加或删除元素的场景。文章首先解释了单向链表的基本概念,包括节点定义及各种操作如插入、删除等的实现方法。随后介绍了双向链表,说明了其拥有前后两个指针的特点,并展示了相关操作的代码实现。最后,对比了ArrayList与LinkedList的不同之处,包括它们底层实现、时间复杂度以及适用场景等方面。
31 10
【数据结构】链表从实现到应用,保姆级攻略
|
9天前
|
存储 C语言
数据结构基础详解(C语言): 栈与队列的详解附完整代码
栈是一种仅允许在一端进行插入和删除操作的线性表,常用于解决括号匹配、函数调用等问题。栈分为顺序栈和链栈,顺序栈使用数组存储,链栈基于单链表实现。栈的主要操作包括初始化、销毁、入栈、出栈等。栈的应用广泛,如表达式求值、递归等场景。栈的顺序存储结构由数组和栈顶指针构成,链栈则基于单链表的头插法实现。
|
9天前
|
存储 C语言
数据结构基础详解(C语言): 树与二叉树的应用_哈夫曼树与哈夫曼曼编码_并查集_二叉排序树_平衡二叉树
本文详细介绍了树与二叉树的应用,涵盖哈夫曼树与哈夫曼编码、并查集以及二叉排序树等内容。首先讲解了哈夫曼树的构造方法及其在数据压缩中的应用;接着介绍了并查集的基本概念、存储结构及优化方法;随后探讨了二叉排序树的定义、查找、插入和删除操作;最后阐述了平衡二叉树的概念及其在保证树平衡状态下的插入和删除操作。通过本文,读者可以全面了解树与二叉树在实际问题中的应用技巧和优化策略。
|
11天前
|
Java
【数据结构】栈和队列的深度探索,从实现到应用详解
本文介绍了栈和队列这两种数据结构。栈是一种后进先出(LIFO)的数据结构,元素只能从栈顶进行插入和删除。栈的基本操作包括压栈、出栈、获取栈顶元素、判断是否为空及获取栈的大小。栈可以通过数组或链表实现,并可用于将递归转化为循环。队列则是一种先进先出(FIFO)的数据结构,元素只能从队尾插入,从队首移除。队列的基本操作包括入队、出队、获取队首元素、判断是否为空及获取队列大小。队列可通过双向链表或数组实现。此外,双端队列(Deque)支持两端插入和删除元素,提供了更丰富的操作。
14 0
【数据结构】栈和队列的深度探索,从实现到应用详解
|
1月前
|
算法 C语言 C++
【practise】栈的压入和弹出序列
【practise】栈的压入和弹出序列
|
7天前
|
存储 人工智能 C语言
数据结构基础详解(C语言): 栈的括号匹配(实战)与栈的表达式求值&&特殊矩阵的压缩存储
本文首先介绍了栈的应用之一——括号匹配,利用栈的特性实现左右括号的匹配检测。接着详细描述了南京理工大学的一道编程题,要求判断输入字符串中的括号是否正确匹配,并给出了完整的代码示例。此外,还探讨了栈在表达式求值中的应用,包括中缀、后缀和前缀表达式的转换与计算方法。最后,文章介绍了矩阵的压缩存储技术,涵盖对称矩阵、三角矩阵及稀疏矩阵的不同压缩存储策略,提高存储效率。
|
1月前
栈的几个经典应用,真的绝了
文章总结了栈的几个经典应用场景,包括使用两个栈来实现队列的功能以及利用栈进行对称匹配,并通过LeetCode上的题目示例展示了栈在实际问题中的应用。
栈的几个经典应用,真的绝了
|
15天前
|
Linux C++ Windows
栈对象返回的问题 RVO / NRVO
具名返回值优化((Name)Return Value Optimization,(N)RVO)是一种优化机制,在函数返回对象时,通过减少临时对象的构造、复制构造及析构调用次数来降低开销。在C++中,通过直接在返回位置构造对象并利用隐藏参数传递地址,可避免不必要的复制操作。然而,Windows和Linux上的RVO与NRVO实现有所不同,且接收栈对象的方式也会影响优化效果。
|
1月前
|
负载均衡 网络协议 安全
DKDP用户态协议栈-kni
DKDP用户态协议栈-kni