《LeetCode刷题计划》前K个高频单词

简介: 《LeetCode刷题计划》前K个高频单词

6c98bb9b8e3f47fcb960fc6046fec693.png一开始的思路:

将所有的单词建立大根堆(按出现的次数完成大根堆的构建(如果出现次数相同,按字典顺序排序)然后按顺序弹出k个元素

class Solution {
    public List<String> topKFrequent(String[] words, int k) {
        Map<String, Integer> map = new HashMap<>();
        for (String word : words) {
            if (map.containsKey(word)) {
                int val = map.get(word); // 注意我们的map.get返回的是Integer引用类型,在这个过程发生了自动拆箱
                map.put(word, val + 1);
            }
            else {
                map.put(word, 1);
            }
        }
        // 程序到了这,我们把单词以及单词出现的次数储存到了Map中
        // 接下来遍历单词列表中所有的key-value映射关系,储存到PriorityQueue中(建立大根堆)
        CountCmp countCmp = new CountCmp();
        PriorityQueue<Map.Entry<String, Integer>> priorityQueue = new PriorityQueue<>(countCmp);
        Set set = map.entrySet(); // 返回所有的 key-value 映射关系, 返回值的类型为Set<Map.Entry<String, Integer>>
        for (Map.Entry<String, Integer> entry : map.entrySet()) {
            priorityQueue.offer(entry);
        }
        // 弹出k个堆顶元素
       List<String> ret = new ArrayList<>();
        for (int i = 0; i < k; ++i) {
            ret.add(priorityQueue.poll().getKey());
        }
        return ret;
    }
}
   // 自定义了一个比较器对象,按出现的次数完成大根堆的构建(如果出现次数相同,按字典顺序排序)
class CountCmp implements Comparator<Map.Entry<String, Integer> >{
    @Override
    public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
        if (o1.getValue().equals(o2.getValue())) {
            return o1.getKey().compareTo(o2.getKey());
        }
        else{
            return o2.getValue().compareTo(o1.getValue()); // 因为这里获取的是Integer引用类型,所以用compareTo来比较
        }
    }
}

改进后的思路

对于前 k 大或前 k 小这类问题,有一个通用的解法:优先队列。优先队列可以在 O(logn) 的时间内完成插入或删除元素的操作(其中 n 为优先队列的大小),并可以O(1) 地查询优先队列顶端元素。


在本题中,我们可以创建一个小根优先队列(顾名思义,就是优先队列顶端元素是最小元素的优先队列)。我们将每一个字符串插入到优先队列中,如果优先队列的大小超过了 k,那么我们就将优先队列顶端元素弹出。这样最终优先队列中剩下的 k 个元素就是前 k 个出现次数最多的单词。

class Solution {
    public static List<String> topKFrequent(String[] words, int k) {
        //1、统计单词出现的次数  key:单词   val: 次数
        Map<String,Integer> map = new HashMap<>();
        for (String word : words) {
            if(map.get(word) == null) {
                map.put(word,1);
            }else {
                int val = map.get(word);
                map.put(word,val+1);
            }
        }
        //2、建立大小为k的 小根堆
        PriorityQueue<Map.Entry<String,Integer>> minHeap =
                new PriorityQueue<>(k,new Comparator<Map.Entry<String, Integer>>() {
            @Override
            public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
                //比较频率
                if(o1.getValue().compareTo(o2.getValue()) == 0) {
                    //做一个转换
                    return o2.getKey().compareTo(o1.getKey());
                }
                //return o1.getValue()-o2.getValue();
                return o1.getValue().compareTo(o2.getValue());
            }
        });
        //遍历map
        for (Map.Entry<String,Integer> entry : map.entrySet()) {
            if(minHeap.size() < k) {
                minHeap.offer(entry);
            }else {
                //此时需要和堆顶元素去比较
                Map.Entry<String,Integer> top = minHeap.peek();
                Integer val = top.getValue();
                // entry是当前的元素
                if(val.compareTo(entry.getValue())<0) {
                    minHeap.poll();
                    minHeap.offer(entry);
                }else if(val.compareTo(entry.getValue()) == 0) {
                    String key = top.getKey();
                    if(key.compareTo(entry.getKey()) > 0) {
                        minHeap.poll();
                        minHeap.offer(entry);
                    }
                }
            }
        }
        List<String> list = new ArrayList<>();
        for (int i = 0; i < k; i++) {
            String key = minHeap.poll().getKey();
            list.add(key);
        }
        Collections.reverse(list);
        return list;
    }
}


相关文章
|
2月前
Leetcode(最后一个单词长度)
这篇文章介绍了两种解决LeetCode第58题的方法,即计算给定字符串中最后一个单词的长度,方法包括翻转字符串和逆向遍历统计。
22 0
|
2月前
【LeetCode 20】151.反转字符串里的单词
【LeetCode 20】151.反转字符串里的单词
20 0
|
4月前
|
算法
LeetCode第58题最后一个单词的长度
LeetCode第58题"最后一个单词的长度"的解题方法,通过从字符串末尾向前遍历并计数非空格字符,直接得出最后一个单词的长度。
LeetCode第58题最后一个单词的长度
|
4月前
|
算法 JavaScript Python
【Leetcode刷题Python】79. 单词搜索和剑指 Offer 12. 矩阵中的路径
Leetcode第79题"单词搜索"的Python解决方案,使用回溯算法在给定的二维字符网格中搜索单词,判断单词是否存在于网格中。
49 4
|
4月前
|
Python
【Leetcode刷题Python】生词本单词整理
文章提供了一个Python程序,用于帮助用户整理和排版生词本上的单词,包括去除重复单词、按字典序排序,并按照特定的格式要求进行打印排版。
44 3
|
4月前
|
Python
【Leetcode刷题Python】318. 最大单词长度乘积
本文提供了LeetCode题目318的Python编程解决方案,题目要求在一个字符串数组中找出两个不含有公共字母的单词,且这两个单词的长度乘积最大,如果不存在这样的两个单词,则返回0。
21 0
|
6月前
|
算法
【LeetCode刷题】滑动窗口解决问题:串联所有单词的子串(困难)、最小覆盖子串(困难)
【LeetCode刷题】滑动窗口解决问题:串联所有单词的子串(困难)、最小覆盖子串(困难)
|
6月前
|
存储 SQL 算法
LeetCode题58: 5种算法实现最后一个单词的长度【python】
LeetCode题58: 5种算法实现最后一个单词的长度【python】
|
6月前
|
算法 测试技术 索引
力扣经典150题第三十二题:串联所有单词的子串
力扣经典150题第三十二题:串联所有单词的子串
28 0
|
6月前
|
算法
力扣经典150题第二十一题:反转字符串中的单词
力扣经典150题第二十一题:反转字符串中的单词
69 0