692.前K个高频单词
难度:中等
题目:
给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
注意:
- 假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
- 输入的单词均由小写字母组成。
示例:
示例 1: 输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2 输出: ["i", "love"] 解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。 注意,按字母顺序 "i" 在 "love" 之前。 示例 2: 输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4 输出: ["the", "is", "sunny", "day"] 解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词, 出现次数依次为 4, 3, 2 和 1 次。
分析:
这道题相信大家第一时间都能想到将单词列表转化为哈希计数表,但困难的就是如何针对该哈希表进行排序。
这里介绍两种方法,各有所长,供大家参考:
- 如果大家之前做过 179.最大数
那么相信你一定对cmp_to_key这个方法不会陌生,它对于Python3提供了sorted过程中的两两比较功能。
我们只需要单独创建一个函数,针对字典K进行函数式排序即可。 - 如果我们不了解cmp_to_key,那么这道题怎么解?老老实实用嵌套列表。
我们将Counter统计好的字典,按照k,v的形式添加进一个列表,然后在对列表排序的时候,对数字与字符串进行分别排序即可。
解题1: cmp_to_key
from collections import Counter from functools import cmp_to_key class Solution: def topKFrequent(self, words, k): d = Counter(words) def cmp(a, b): if d[a] > d[b]: return -1 elif d[a] == d[b]: return -1 if sorted([a, b])[0] == a else 1 else: return 1 return sorted(d.keys(), key=cmp_to_key(cmp))[:k]
解题2: 列表切片
from collections import Counter class Solution: def topKFrequent(self, words, k: int): d = Counter(words) tmp = [] for word, num in d.items(): tmp.append((num, word)) ret = sorted(tmp, key=lambda x: (-x[0], x[1])) return [i[1] for i in ret[:k]]