TopK问题(快排变形/优先级队列)

简介: TopK问题(快排变形/优先级队列)

1.数组中第k大/前k大的元素(215-中)



示例

输入: [3,2,1,5,6,4] 和 k = 2
输出: 5
输入: [3,2,1,5,6,4] 和 k = 2
输出: [5, 6]


思路


法1:快排变形:类似传统快排,区别在于,我们每次进行划分得到的索引index,我们只需要比较该索引值与目标索引的大小,继续递归满足条件的区间,而不需要对整个数组进行排序;


法2:优先队列:直接利用java现成的PriorityQueue优先队列实现(默认小根堆),维持有K个元素的小根堆,最终返回堆顶或者将堆中所有元素输出。


代码1:时间复杂度O(n)

// 数组中第k大元素
public int findKthLargest(int[] nums, int k) {
    if (nums == null || nums.length == 0 || k == 0) return 0;
    int target = nums.length - k;
    return quickSort(nums, 0, nums.length - 1, target);
}
private int quickSort(int[] nums, int l, int r, int target) {
    int index = partition(nums, l, r);
    if (index == target) return nums[index];
    return index > target ? quickSort(nums, l, index - 1, target) : quickSort(nums, index + 1, r, target);
}
// 划分过程:一定要随机选取划分值!
private int partition(int[] nums, int l, int r) {
    swap(nums, l + (int)(Math.random() * (r - l + 1)), r);
    int less = l - 1, more = r;
    while (l < more) {
        if (nums[l] < nums[r]) {
            swap(nums, ++less, l++);
        } else if (nums[l] > nums[r]) {
            swap(nums, --more, l);
        } else {
            l++;
        }
    }
    swap(nums, more, r);
    return more;
}
public void swap(int[] nums, int i, int j) {
    int temp = nums[i];
    nums[i] = nums[j];
    nums[j] = temp;
}


代码2:时间复杂度O(nlogk)

// 数组第k大元素的队列实现
public int findKthLargest(int[] nums, int k) {
    PriorityQueue<Integer> pq = new PriorityQueue<>();
    for (int num : nums) {
        pq.add(num);
        // 维持小根堆大小为K
        if (pq.size() > k) {
            pq.poll();
        }
    }
    return pq.peek();
}
// 数组前k大元素的队列实现
public int[] largestK(int[] arr, int k) {
    if (arr == null || arr.length == 0 || k == 0) return new int[0];
    Queue<Integer> pq = new PriorityQueue<>();
    for (int num : arr) {
        pq.add(num);
        if (pq.size() > k) {
            pq.poll();
        }
    }
    int[] ans = new int[pq.size()];
    int index = 0;
    for (int i : pq) {
        ans[index++] = i;
    }
    return ans;
}


2.数组中第k小/前k小个的元素(面试题)



示例

输入: [3,2,1,5,6,4] 和 k = 2
输出: 5
输入: arr = [1,3,5,7,2,4,6,8], k = 4
输出: [1,2,3,4]


思路


法1:快排变形:与上题思路相同,唯一不同的就是目标索引,数组中第k小/前k小个的元素为k - 1


法2:优先队列:重写比较方法,维持有K个元素的小根堆,最终返回堆顶或者将堆中所有元素输出。


代码1:时间复杂度O(n)

// 数组中前k小的元素
public int[] smallestK(int[] arr, int k) {
    if (k == 0 || arr == null || arr.length == 0) return new int[0];
    // 注意:第k小的元素下标为k - 1
    return quickSort(arr, 0, arr.length - 1, k - 1);
}
private int[] quickSort(int[] arr, int l, int r, int k) {
    int index = partition(arr, l, r);
    if (index == k) {
        // 复制数组arr的前k个数,也就是0 - k-1
        return Arrays.copyOf(arr, index + 1);
    }
    return index > k ? quickSort(arr, l, index - 1, k) : quickSort(arr, index + 1, r, k);
}
private int partition(int[] arr, int l, int r) {
    // 随机选取划分值
    swap(arr, l + (int)(Math.random() * (r - l + 1)), r);
    int less = l - 1, pivot = arr[r];
    for (int i = l; i < r; ++i) {
        if (arr[i] <= pivot) {
            swap(arr, ++less, i);
        }
    }
    swap(arr, less + 1, r);
    return less + 1;
}
public void swap(int[] arr, int i, int j) {
    int temp = arr[i];
    arr[i] = arr[j];
    arr[j] = temp;
}


代码2:时间复杂度O(nlogk)

// 数组第k小的队列实现
public int findKthSmallest(int[] nums, int k) {
    if (nums == null || nums.length == 0 || k == 0) return new int[0];
    Queue<Integer> pq = new PriorityQueue<>((v1, v2) -> v2 - v1);
    for (int num : nums) {
        pq.add(num);
        if (pq.size() > k) {
            pq.poll();
        }
    }
    return pq.peek();
}
// 前k小的元素
public int[] smallestK(int[] arr, int k) {
    if (arr == null || arr.length == 0 || k == 0) return new int[0];
    Queue<Integer> pq = new PriorityQueue<>((v1, v2) -> v2 - v1);
    for (int num : arr) {
        pq.add(num);
        if (pq.size() > k) {
            pq.poll();
        }
    }
    int[] ans = new int[pq.size()];
    int index = 0;
    for (int i : pq) {
        ans[index++] = i;
    }
    return ans;
}


队列的add()方法和offer()方法的区别


两者都是往队列尾部插入元素,不同的时候,当超出队列界限的时候,


  • add()方法是抛出异常让你处理,
  • offer()方法是直接返回false


总结



topk问题还有像线性查找算法(bfprt)等高效的算法,这里只介绍使用快排思路实现和优先级队列实现两种思路。


  • 优先队列:代码简单,即遍历数组,维护一个大小为k的堆(面试可以先写出),但是时间复杂度较高O(NlogK)。
  • 快排变形:关键是我们无需对不需要的区间进行排序,只需要找到目标值或者目标区间即可,可在O(N)时间复杂度解决问题。


对于快排变形


  • 数组中第k大/前k大的元素:目标索引为nums.length - k
  • 数组中第k小/前k小个的元素:目标索引为k - 1


对于优先队列


  • 数组中第k大/前k大的元素:使用小根堆(堆顶元素最小,PriorityQueue默认实现);
  • 数组中第k小/前k小个的元素:使用大根堆(堆顶元素)。


最终的返回区间结果


  • 快排变形:使用Arrays.copyOf(arr, k):返回arr数组的前k个数;
  • 优先队列:直接使用增强for循环取出队列元素存入数组。


参考鸣谢:


https://zhuanlan.zhihu.com/p/114699207

相关文章
|
8月前
|
算法 测试技术 C++
【动态规划】【滑动窗口】【C++算法】 629K 个逆序对数组
【动态规划】【滑动窗口】【C++算法】 629K 个逆序对数组
|
算法 搜索推荐 大数据
【算法】排序——归并排序和计数排序
上两篇文章讲解了插入排序、选择排序以及交换排序,每种类型的排序大类下都有一到两种排序,今天给大家带来的是归并排序,和前面几种排序一样都属于比较排序中的一种,是通过比较数组中的元素来实现排序的,还给大家带来一种非比较排序计数排序,让我们开始今天的排序之吧!!!
|
8月前
|
搜索推荐
【hoare优化版】快速排序算法 | 三数取中&小区间优化(2)
【hoare优化版】快速排序算法 | 三数取中&小区间优化(2)
92 0
|
8月前
|
存储 算法 搜索推荐
【算法训练-排序算法 二】【快速排序】数组中的第K个最大元素、最小的K个数
【算法训练-排序算法 二】【快速排序】数组中的第K个最大元素、最小的K个数
80 0
算法:分治思想处理快排递归以及快速选择/最小K个数问题
算法:分治思想处理快排递归以及快速选择/最小K个数问题
|
机器学习/深度学习 算法
【二叉树的顺序结构:堆 && 堆排序 && TopK](二)
【二叉树的顺序结构:堆 && 堆排序 && TopK](二)
73 0
|
算法 搜索推荐
|
存储 Go C语言
堆排序在topK场景题中的应用及原理
堆排序在topK场景题中的应用及原理
157 0
堆排序在topK场景题中的应用及原理
|
算法 API 索引
算法排序6——快速排序(分治思想)
对于左侧的数组数据,又可以取一个分界值,将该部分数据分成左右两部分,同样在左边放置较小值,右边放置较大值。右侧的数组数据也可以做类似处理
138 0
算法排序6——快速排序(分治思想)
|
机器学习/深度学习 算法 API
算法排序5——归并排序&分治思想
算法排序5——归并排序&分治思想
125 0
算法排序5——归并排序&分治思想