数据结构与算法——堆的应用

简介: 前面说完了堆这种数据结构,并且讲到了它很经典的一个应用:堆排序,其实堆这种数据结构还有其他很多的应用,今天就一起来看看,主要有下列内容:• 优先级队列• 求 Top K 问题• 求中位数

1. 概述


前面说完了堆这种数据结构,并且讲到了它很经典的一个应用:堆排序,其实堆这种数据结构还有其他很多的应用,今天就一起来看看,主要有下列内容:

  • 优先级队列
  • 求 Top K 问题
  • 求中位数


2. 优先级队列


优先级队列是一种特殊的队列,前面学习队列的时候,说到队列满足 先进先出,后进后出 的特点,优先级队列则不是这样。优先级队列中的数据,出队的顺序是有优先级的,优先级高的,先出队列。

而堆其实就可以看作是一个优先级队列,因为堆顶元素总是数据中最大或最小的元素,每次出队列都可以看作取出堆顶元素。

如果你熟悉 Java 语言,则或多或少听说或是使用过 PriorityQueue 这个容器,在《Java 核心技术·卷 I》中,说到 PriorityQueue 就是优先级队列,并且它基于一种很优雅的数据结构——堆。

接下来就小试牛刀,举一个具体的例子来看看优先级队列的应用。例如我们需要合并 10 个有序的小文件,小文件中存储的是有序的字符串数据。借助优先级队列,我们可以很高效的解决这个问题。

我们从每个文件中读取第一个字符串存入优先级队列中,那么每次出队列,都是最小的那个元素。将出队列的数据存储到一个大文件中,然后继续从文件中读取一个字符串存入队列,然后继续出队列,一直循环这个操作。

当然,这主要是针对数据文件较大的情况,如果数据不多,那么直接将全部的数据存入队列,然后依次出队列就可以了,具体问题具体分析。


3. Top K 问题


这样的问题其实非常的常见了,在一组数据当中 ,我们需要求得其前 K 大的数据。

这分为了两种情况,一是针对 静态数据 ,即数据不会发生变化。我们可以维护一个大小为 K 的小顶堆,然后依次遍历数组,如果数组数据比堆顶元素大,则插入到堆中,如果小,则不做处理。遍历完之后,则堆中存在的数据就是 Top K 了。我用代码模拟了这个过程:

public class GetTopK {
    public static void main(String[] args) {
        int[] num = {2, 34, 45, 56, 76, 65, 678, 33, 888, 678, 98, 0, 7};
        //求 Top 3
        Queue<Integer> queue = new PriorityQueue<>(3);
        queue.add(num[0]);
        queue.add(num[1]);
        queue.add(num[2]);
        for (int i = 3; i < num.length; i++) {
            int small = queue.peek();
            if (num[i] > small){
                queue.poll();
                queue.add(num[i]);
            }
        }
        System.out.println(queue.toString());
    }
}


第二种情况,是动态的数据集合,数据会有增加、删除的情况,如果新增一个元素,将其和堆顶元素进行比较,如果数据比堆顶元素大,则插入到堆中,如果小,则不做处理。这样的话,无论数据怎样变化,我们都能够随时拿到 Top K,而不用因为数据的变化重新组织堆。


4. 求中位数


顾名思义,中位数就是一组数据中最中间的那个数据,只不过注意,数据需要有序排列。针对一个大小为 n 的数据集,如果 n 为偶数,那么中位数有两个,分别是 n/2 和 n/2 + 1 这两个数据,我们可以随机取其中一个;如果 n 为奇数,则 n/2 + 1 这个数为中位数。

如果是一个静态的数据,那么可直接排序然后求中位数,但是如果数据有变化,这样每次排序的成本太高了。所以,可以借助堆来实现求中位数的功能。

我们可以维护一个大顶堆,一个小顶堆,小顶堆中存储后 n/2 个数据,大顶堆中存储前面剩余的数据。如果 n 是偶数,则两个堆中存储的都是相同个数的数据,如果 n 为奇数,则大顶堆中要多一个数据。结合下图你就很容易明白了:

如果有数据插入的情况,如果数据小于等于大顶堆顶元素,则插入到大顶堆中,如果数据大于等于小顶堆顶元素,则插入到小顶堆中。只不过可能会出现一个问题,就是堆中的数据不满足均分情况,那么我们需要移动两个堆中的元素,反正需要保证 大顶堆的元素个数和小顶堆的元素个数要么相等,或者大顶堆中多一个。

我用代码简单模拟了整个实现:

public class GetMiddleNum {
        public static void main(String[] args) {
            //原始数据
            Integer[] num = {12, 34, 6, 43, 78, 65, 42, 33, 5, 8};
            //排序后存入ArrayList中
            Arrays.sort(num);
            ArrayList<Integer> data = new ArrayList<>(Arrays.asList(num));
            //大顶堆
            Queue<Integer> bigQueue = new PriorityQueue<>((o1, o2) -> {
                if (o1 <= o2) return 1;
                else return -1;
            });
            //小顶堆
            Queue<Integer> smallQueue = new PriorityQueue<>();
            int n = data.size();
            int i;
            if (n % 2 == 0) i = n / 2;
            else i = n / 2 + 1;
            //后 n/2 的数据存入到小顶堆中
            for (int j = i; j < n; j++) {
                smallQueue.add(data.get(j));
            }
            //前面的数据存入到大顶堆中
相关文章
|
11天前
|
存储 算法 Java
散列表的数据结构以及对象在JVM堆中的存储过程
本文介绍了散列表的基本概念及其在JVM中的应用,详细讲解了散列表的结构、对象存储过程、Hashtable的扩容机制及与HashMap的区别。通过实例和图解,帮助读者理解散列表的工作原理和优化策略。
25 1
散列表的数据结构以及对象在JVM堆中的存储过程
|
23天前
|
存储 Java
Java中的HashMap和TreeMap,通过具体示例展示了它们在处理复杂数据结构问题时的应用。
【10月更文挑战第19天】本文详细介绍了Java中的HashMap和TreeMap,通过具体示例展示了它们在处理复杂数据结构问题时的应用。HashMap以其高效的插入、查找和删除操作著称,而TreeMap则擅长于保持元素的自然排序或自定义排序,两者各具优势,适用于不同的开发场景。
37 1
|
28天前
|
存储 算法 C语言
通义灵码在考研C语言和数据结构中的应用实践 1-5
通义灵码在考研C语言和数据结构中的应用实践,体验通义灵码的强大思路。《趣学C语言和数据结构100例》精选了五个经典问题及其解决方案,包括求最大公约数和最小公倍数、统计字符类型、求特殊数列和、计算阶乘和双阶乘、以及求斐波那契数列的前20项和。通过这些实例,帮助读者掌握C语言的基本语法和常用算法,提升编程能力。
|
28天前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
41 3
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的优化算法及其应用
【10月更文挑战第8天】 本文将探讨深度学习中常用的优化算法,包括梯度下降法、Adam和RMSProp等,介绍这些算法的基本原理与应用场景。通过实例分析,帮助读者更好地理解和应用这些优化算法,提高深度学习模型的训练效率与性能。
138 63
|
13天前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
56 16
|
1月前
|
缓存 算法 Java
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
这篇文章详细介绍了Java虚拟机(JVM)中的垃圾回收机制,包括垃圾的定义、垃圾回收算法、堆内存的逻辑分区、对象的内存分配和回收过程,以及不同垃圾回收器的工作原理和参数设置。
60 4
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
|
12天前
|
机器学习/深度学习 JSON 算法
二叉树遍历算法的应用场景有哪些?
【10月更文挑战第29天】二叉树遍历算法作为一种基础而重要的算法,在许多领域都有着不可或缺的应用,它为解决各种复杂的问题提供了有效的手段和思路。随着计算机科学的不断发展,二叉树遍历算法也在不断地被优化和扩展,以适应新的应用场景和需求。
22 0
|
22天前
|
机器学习/深度学习 存储 人工智能
数据结构在实际开发中的广泛应用
【10月更文挑战第20天】数据结构是软件开发的基础,它们贯穿于各种应用场景中,为解决实际问题提供了有力的支持。不同的数据结构具有不同的特点和优势,开发者需要根据具体需求选择合适的数据结构,以实现高效、可靠的程序设计。
49 7
|
23天前
|
存储 算法 搜索推荐
这些算法在实际应用中有哪些具体案例呢
【10月更文挑战第19天】这些算法在实际应用中有哪些具体案例呢
25 1