【刷穿 LeetCode】面试题 17.14. 最小K个数:「优先队列(堆)」&「全排序」&「数组划分」

简介: 【刷穿 LeetCode】面试题 17.14. 最小K个数:「优先队列(堆)」&「全排序」&「数组划分」

网络异常,图片无法展示
|

题目描述



这是 LeetCode 上的 面试题 17.14. 最小K个数 ,难度为 中等


Tag : 「优先队列」、「堆」、「排序」


设计一个算法,找出数组中最小的k个数。以任意顺序返回这k个数均可。


示例:


输入: arr = [1,3,5,7,2,4,6,8], k = 4
输出: [1,2,3,4]
复制代码


提示:


  • 0 <= len(arr) <= 100000
  • 0 <= k <= min(100000, len(arr))


优先队列(小根堆)



一个直观的想法是使用「优先队列(小根堆)」,起始将所有元素放入堆中,然后再从堆中取出 kk 个元素并「顺序」构造答案。


网络异常,图片无法展示
|


代码:


class Solution {
    public int[] smallestK(int[] arr, int k) {
        PriorityQueue<Integer> q = new PriorityQueue<>((a,b)->a-b);
        for (int i : arr) q.add(i);
        int[] ans = new int[k];
        for (int i = 0; i < k; i++) ans[i] = q.poll();
        return ans;
    }
}
复制代码


  • 时间复杂度:建堆复杂度为 O(n\log{n})O(nlogn),构造答案复杂度为 O(k\log{n})O(klogn)。整体复杂度为 O(n\log{n})O(nlogn)
  • 空间复杂度:O(n + k)O(n+k)


优先队列(大根堆)



在解法一中,我们将所有的原始都放入堆中,堆中元素最多有 nn 个,这导致了我们复杂度的上界为 O(n\log{n})O(nlogn)


而另外一个比较优秀的做法是,使用「优先队列(大根堆)」。


当处理到原始 arr[i]arr[i] 时,根据堆内元素个数,以及其与堆顶元素的关系分情况讨论:


  • 堆内元素不足 kk 个:直接将 arr[i]arr[i] 放入堆内;
  • 堆内元素为kk个:根据arr[i]arr[i]与堆顶元素的大小关系分情况讨论:
  • arr[i] >= heapToparr[i]>=heapToparr[i]arr[i] 不可能属于第 kk 小数(已有 kk 个元素在堆中),直接丢弃 arr[i]arr[i]
  • arr[i] < heapToparr[i]<heapToparr[i]arr[i] 可能属于第 kk 小数,弹出堆顶元素,并放入 arr[i]arr[i]


arrarr 被处理完,我们再使用堆中元素「逆序」构造答案。


网络异常,图片无法展示
|


代码:


class Solution {
    public int[] smallestK(int[] arr, int k) {
        PriorityQueue<Integer> q = new PriorityQueue<>((a,b)->b-a);
        int[] ans = new int[k];
        if (k == 0) return ans;
        for (int i : arr) {
            if (q.size() == k && q.peek() <= i) continue;
            if (q.size() == k) q.poll();
            q.add(i);
        }
        for (int i = k - 1; i >= 0; i--) ans[i] = q.poll();
        return ans;
    }
}
复制代码


  • 时间复杂度:建堆复杂度为 O(n\log{k})O(nlogk),构造答案复杂度为 O(k\log{k})O(klogk)。整体复杂度为 O(n\log{k})O(nlogk)
  • 空间复杂度:O(k)O(k)


全排序



Java 中的 Arrays.sort 为综合排序实现。会根据数据规模、元素本身是否大致有序选择不同的排序实现。


因此一个比较省事的实现是先使用 Arrays.sort 进行排序,再构造答案。


网络异常,图片无法展示
|


代码:


class Solution {
    public int[] smallestK(int[] arr, int k) {
        Arrays.sort(arr);
        int[] ans = new int[k];
        for (int i = 0; i < k; i++) ans[i] = arr[i];
        return ans;
    }
}
复制代码


  • 时间复杂度:排序(假定 Arrays.sort 使用的是双轴快排实现)的复杂度为 O(n\log{n})O(nlogn);构造答案复杂度为 O(k)O(k)。整体复杂度为 O(n\log{n})O(nlogn)
  • 空间复杂度:O(\log{n} + k)O(logn+k)


快排数组划分



注意到题目要求「任意顺序返回这 kk 个数即可」,因此我们只需要确保前 kk 小的数都出现在下标为 [0, k)[0,k) 的位置即可。


利用「快速排序」的数组划分即可做到。


我们知道快排每次都会将小于等于基准值的值放到左边,将大于基准值的值放到右边。


因此我们可以通过判断基准点的下标 idxidxkk 的关系来确定过程是否结束:


  • idx < kidx<k:基准点左侧不足 kk 个,递归处理右边,让基准点下标右移;
  • idx > kidx>k:基准点左侧超过 kk 个,递归处理左边,让基准点下标左移;
  • idx = kidx=k:基准点左侧恰好 kk 个,输出基准点左侧元素。


网络异常,图片无法展示
|


代码:


class Solution {
    int k;
    public int[] smallestK(int[] arr, int _k) {
        k = _k;
        int n = arr.length;
        int[] ans = new int[k];
        if (k == 0) return ans;
        qsort(arr, 0, n - 1);
        for (int i = 0; i < k; i++) ans[i] = arr[i];
        return ans;
    }
    void qsort(int[] arr, int l, int r) {
        if (l >= r) return ;
        int i = l, j = r;
        int ridx = new Random().nextInt(r - l + 1) + l;
        swap(arr, ridx, l);
        int x = arr[l];
        while (i < j) {
            while (i < j && arr[j] >= x) j--;
            while (i < j && arr[i] <= x) i++;
            swap(arr, i, j);
        }
        swap(arr, i, l);
        // 集中答疑:因为题解是使用「基准点左侧」来进行描述(不包含基准点的意思),所以这里用的 k(写成 k - 1 也可以滴
        if (i > k) qsort(arr, l, i - 1);
        if (i < k) qsort(arr, i + 1, r);
    }
    void swap(int[] arr, int l, int r) {
        int tmp = arr[l];
        arr[l] = arr[r];
        arr[r] = tmp;
    }
}
复制代码


  • 时间复杂度:由于每次都会随机选择基准值,因此每次递归的数组平均长度为 n / 2n/2,那么划分数组操作的次数不会超过 2 * n2n。整体复杂度为 O(n)O(n)
  • 空间复杂度:O(\log{n})O(logn)


最后



这是我们「刷穿 LeetCode」系列文章的第 No.面试题 17.14 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
2月前
|
Java
【Java基础面试三十二】、new String(“abc“) 是去了哪里,仅仅是在堆里面吗?
这篇文章解释了Java中使用`new String("abc")`时,JVM会将字符串直接量"abc"存入常量池,并在堆内存中创建一个新的String对象,该对象会指向常量池中的字符串直接量。
|
2月前
|
算法
LeetCode第53题最大子数组和
LeetCode第53题"最大子数组和"的解题方法,利用动态规划思想,通过一次遍历数组,维护到当前元素为止的最大子数组和,有效避免了复杂度更高的暴力解法。
LeetCode第53题最大子数组和
|
2月前
|
存储 Java API
LeetCode------合并两个有序数组(4)【数组】
这篇文章介绍了LeetCode上的"合并两个有序数组"问题,并提供了三种解法:第一种是使用Java的Arrays.sort()方法直接对合并后的数组进行排序;第二种是使用辅助数组和双指针技术进行合并;第三种则是从后向前的双指针方法,避免了使用额外的辅助数组。
LeetCode------合并两个有序数组(4)【数组】
LeetCode------找到所有数组中消失的数字(6)【数组】
这篇文章介绍了LeetCode上的"找到所有数组中消失的数字"问题,提供了一种解法,通过两次遍历来找出所有未在数组中出现的数字:第一次遍历将数组中的每个数字对应位置的值增加数组长度,第二次遍历找出所有未被增加的数字,即缺失的数字。
|
2月前
|
前端开发
LeetCode------移动零(5)【数组】
这篇文章介绍了LeetCode上的"移动零"问题,提出了一种使用双指针的原地操作解法,该方法首先将非零元素移动到数组前端并保持相对顺序,然后填充后续位置为零,以达到题目要求。
|
2月前
|
存储 算法
LeetCode第83题删除排序链表中的重复元素
文章介绍了LeetCode第83题"删除排序链表中的重复元素"的解法,使用双指针技术在原链表上原地删除重复元素,提供了一种时间和空间效率都较高的解决方案。
LeetCode第83题删除排序链表中的重复元素
|
2月前
|
算法
LeetCode第81题搜索旋转排序数组 II
文章讲解了LeetCode第81题"搜索旋转排序数组 II"的解法,通过二分查找算法并加入去重逻辑来解决在旋转且含有重复元素的数组中搜索特定值的问题。
LeetCode第81题搜索旋转排序数组 II
|
2月前
|
算法 索引
LeetCode第34题在排序数组中查找元素的第一个和最后一个位置
这篇文章介绍了LeetCode第34题"在排序数组中查找元素的第一个和最后一个位置"的解题方法,通过使用双指针法从数组两端向中间同时查找目标值,有效地找到了目标值的首次和最后一次出现的索引位置。
LeetCode第34题在排序数组中查找元素的第一个和最后一个位置
|
2月前
|
算法
LeetCode第33题搜索旋转排序数组
这篇文章介绍了LeetCode第33题"搜索旋转排序数组"的解题方法,通过使用二分查找法并根据数组的有序性质调整搜索范围,实现了时间复杂度为O(log n)的高效搜索算法。
LeetCode第33题搜索旋转排序数组
|
2月前
|
开发者 索引 Python
这些年背过的面试题——LeetCode
本文是技术人面试系列LeetCode篇,一文带你详细了解,欢迎收藏!