昨日回顾
昨天,我们针对Java中的 HashMap 、HashSet ,和Python中的 dict & set 使用,进行了分类学习,并按照表格总结了不同数据结构所包含的方法与使用场景。在这两个数据结构上,Python与Java倒是大同小异,没有过多的差别。
之后,通过两道题目简单了解了这类题型的解题方式。那么今天,我们在此基础上进一步来熟悉下哈希表解题的运用。
先来一道阅读理解题目热热身子吧!
剑指OfferII034.外星语言是否排序
https://leetcode-cn.com/problems/lwyVBB/solution/shua-chuan-jian-zhi-offer-day16-ha-xi-bi-mtik/
难度:简单
题目:
某种外星语也使用英文小写字母,但可能顺序 order 不同。字母表的顺序(order)是一些小写字母的排列。
给定一组用外星语书写的单词 words,以及其字母表的顺序 order,只有当给定的单词在这种外星语中按字典序排列时,
返回 true;否则,返回 false。
提示:
- 1 <= words.length <= 100
- 1 <= words[i].length <= 20
- order.length == 26
- 在 words[i] 和 order 中的所有字符都是英文小写字母。
示例:
示例 1: 输入:words = ["hello","leetcode"], order = "hlabcdefgijkmnopqrstuvwxyz" 输出:true 解释:在该语言的字母表中,'h' 位于 'l' 之前,所以单词序列是按字典序排列的。 示例 2: 输入:words = ["word","world","row"], order = "worldabcefghijkmnpqstuvxyz" 输出:false 解释:在该语言的字母表中,'d' 位于 'l' 之后,那么 words[0] > words[1],因此单词序列不是按字典序排列的。 示例 3: 输入:words = ["apple","app"], order = "abcdefghijklmnopqrstuvwxyz" 输出:false 解释:当前三个字符 "app" 匹配时,第二个字符串相对短一些,然后根据词典编纂规则 "apple" > "app", 因为 'l' > '∅',其中 '∅' 是空白字符,定义为比任何其他字符都小(更多信息)。
分析
坦白说这是一道阅读理解题目,能仔细看清楚题目要求的比较规则,就差不多已经通过了...
根据外星人的英文字母顺序,比较words列表中的每个单词是按照 升序 排列的,则返回 true ,否则返回 false
那么如何比较每个单词的顺序呢?通过观察示例,我们了解到其实就是针对单词去按位比较,在order中的顺序。
这里注意下,如果长度不够,以空补充,空即无穷小。
理解了上面的思路,就可以开始编写解题了:
- 比较单词的出现顺序,可以用到哈希表去快速获取单词的排序下标,既然是哈希表专题,就不用ascii配合数组模拟哈希了。
- 然后就要开始单词的逐个比较了,这个可以参考冒泡排序的方式两两比较,a<b且b<c,则肯定a < c
- 如果遇到left[index] > right[index] 直接返回False,无需其他操作了
- 如果遇到left[index] < right[index] 类似 109 < 110 十位已经小了,后面就没必要看了,直接break接着比较下一个。
- 如果第三步一直没有false,最终返回true即可。
来看看具体解题吧:
解题:
Python:
class Solution: def isAlienSorted(self, words: List[str], order: str) -> bool: dic = {j: i for i, j in enumerate(order)} for i in range(len(words) - 1): w1, w1_len = words[i], len(words[i]) w2, w2_len = words[i + 1], len(words[i + 1]) for idx in range(max(w1_len, w2_len)): w1_idx = -1 if idx >= w1_len else dic[w1[idx]] w2_idx = -1 if idx >= w2_len else dic[w2[idx]] if w1_idx > w2_idx: return False if w1_idx < w2_idx: break return True
Java:
class Solution { public boolean isAlienSorted(String[] words, String order) { HashMap<Character, Integer> map = new HashMap<>(); for (int i = 0; i < order.length(); i++) { map.put(order.charAt(i), i); } for (int i = 0; i < words.length - 1; i++) { String w1 = words[i]; int w1_len = w1.length(); String w2 = words[i + 1]; int w2_len = w2.length(); for (int j = 0; j < Math.max(w1_len, w2_len); j++) { int idx_w1 = j > w1_len ? -1 : map.get(w1.charAt(j)); int idx_w2 = j > w2_len ? -1 : map.get(w2.charAt(j)); if (idx_w1 > idx_w2) return false; if (idx_w1 < idx_w2) break; } } return true; } }
这道阅读理解的题目,是不是一下子把自信就给找回来了?
虽然说哈希表是算法中最常用的数据结构,但是它却比较比较简单而纯粹,当你需要优化时间的时候,就使用它来把时间转换为空间。就是这么简单....
注意:但下面我要不按套路出牌的给大家分享一道很特别的哈希表题目了,快来看看吧。
525.连续数组
难度:中等
题目:
给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组,
并返回该子数组的长度。
示例:
示例 1: 输入: nums = [0,1] 输出: 2 说明: [0, 1] 是具有相同数量0和1的最长连续子数组。 示例 2: 输入: nums = [0,1,0] 输出: 2 说明: [0, 1] (或 [1, 0]) 是具有相同数量0和1的最长连续子数组。 示例 3: 输入: nums = [0,0,1,0,0,0,1,1] 输出: 6 说明: [1,0,0,0,1,1] 是具有相同数量0和1的最长连续子数组。
分析
不得不说,如果这道题的用例是-1 和 1,那么大家可能还比较容易产生思路,可惜这道题是0 和 1,我们需要转化一下
为什么要转化为-1 和 1呢?
因为如果具有相同的-1 和 1,由于它们数目相同,所以这些数字加起来就等于0。
加起来,看到这个关键字是不是该想到我们在数组中学习到的前缀和了?
我们采用前缀的方式,当前缀和的某一个数和之前的某一个位置的数字相等,那是不是在这段数组之间出现了相同数目的-1 和 1,所以抵消为0 了。
配合Hash表的使用,我们可以快速记录 {前缀和: 下标} 的关系, 由于可能存在nums前N数字和刚好满足条件的情况,所以我们预制烧饼节点{0,-1},来规避该问题。
循环判断是否在字典中存在前缀和一样的键,并不断判断最长符合题意的连续数组,最终返回即可。
千言万语化作一张图,一看就明白了:
在index = 7的位置前缀和为 -2, 而哈希表中在index = 1的位置前缀和也为-2。这便是我们通过前缀和+哈希表来解题的思路了。
解题:
Python:
class Solution: def findMaxLength(self, nums): d = {0: -1} ret = pre_sum = 0 for i, num in enumerate(nums): pre_sum += 1 if num == 1 else -1 pre_index = d.get(pre_sum, i) if pre_index == i: d[pre_sum] = i else: ret = max(ret, i - pre_index) return ret
Java:
class Solution { public int findMaxLength(int[] nums) { HashMap<Integer, Integer> map = new HashMap<>(); map.put(0, -1); int pre_sum = 0; int ret = 0; for (int i = 0; i < nums.length; i++) { pre_sum += nums[i] == 1 ? 1 : -1; int pre_index = map.getOrDefault(pre_sum, i); if (pre_index == i) { map.put(pre_sum, i); } else { ret = Math.max(ret, i - pre_index); } } return ret; } }
个人感觉 525.连续数组 是一道比较综合的算法题目,涉及到我们之前学习的前缀思维,与本章的哈希表的结合。
反倒是 剑指 Offer II 035. 最小时间差 作为哈希表的最后一道题显得有些不伦不类。所以这道题就留给大家作为课后作业了。