刷穿剑指offer-Day09-字符串II 使用哈希表解决字符串题目

简介: 刷穿剑指offer-Day09-字符串II 使用哈希表解决字符串题目

昨日回顾


从昨天开始,我们进入了第三章字符串的学习。然而所为的字符串专题,在讲解后,大家应该了解到字符串的题目,其实都是将字符串转化为其他数据类型后,再进行解题的过程。例如字符串转化为数组、栈、哈希表、队列等等。

昨天在文末,将剑指offer的015题作为课后作业留给大家下来练习。不知道有多少人自觉完成了呢?我猜没几个....

那么今天开篇,想讲解一下昨天的作业吧。


剑指OfferII015.字符串中的所有变位词


https://leetcode-cn.com/problems/VabMRr/solution/shua-chuan-jian-zhi-offer-day09-zi-fu-ch-f3mv/

难度:中等


题目:

给定两个字符串 s 和 p,找到 s 中所有 p 的 变位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

变位词 指字母相同,但排列不同的字符串。

提示:

  • 1 <= s.length, p.length <= 3 * 10 ^ 4
  • s 和 p 仅包含小写字母


示例:

示例 1:
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的变位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的变位词。
示例 2:
输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的变位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的变位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的变位词。


分析

昨天的文章中,我们学习使用长度为26的数组,来建立字符串数量与数组下标对应关系的操作。

通过对应关系,判断数组相等的方式,来实现字母异位词的操作。如果忘记了可以复习下昨天的解题

那么今天的这道题,相比于14题有什么变化么?答案是几乎没有...

昨天我们在循环过程中判断如果找到异位词立即返回,今天的题目,我们只需要在遇到异位词时记录此时的起始index,保存在数组。

然后返回数组即可,就这么点差别,看我们ctrl c v 14题的解题,快速解题。


解题:


Python:

class Solution:
    def findAnagrams(self, s: str, p: str) -> List[int]:
        arr1, arr2, lg, ret = [0] * 26, [0] * 26, len(p), []
        if lg > len(s):
            return []
        for i in range(lg):
            arr1[ord(p[i]) - ord('a')] += 1
            arr2[ord(s[i]) - ord('a')] += 1
        if arr1 == arr2:
            ret.append(0)
        for i in range(lg,len(s)):
            arr2[ord(s[i]) - ord('a')] += 1
            arr2[ord(s[i - lg]) - ord('a')] -= 1
            if arr1 == arr2:
                ret.append(i - lg + 1)
        return ret


Java:

class Solution {
    public List<Integer> findAnagrams(String s, String p) {
        int[] arr1 = new int[26];
        int[] arr2 = new int[26];
        List<Integer> list = new ArrayList<Integer>();
        if (p.length() > s.length()) {
            return list;
        }
        for (int i = 0; i < p.length(); i++) {
            arr1[p.charAt(i) - 'a']++;
            arr2[s.charAt(i) - 'a']++;
        }
        if (Arrays.equals(arr1, arr2)) {
            list.add(0);
        }
        for (int i = p.length(); i < s.length(); i++) {
            arr2[s.charAt(i - p.length()) - 'a']--;
            arr2[s.charAt(i) - 'a']++;
            if (Arrays.equals(arr1, arr2)) {
                list.add(i - p.length() + 1);
            }
        }
        return list;
    }
}


使用哈希表解字符串


昨天文章讲解和作业的两道题目,都是使用数组来解决字符串的题目,相信这个套路大家已经掌握了。

那么什么时候会使用到哈希表来解决字符串的问题呢?今天让我们来看一道这样的题目吧。


剑指offerII016.不含重复字符串的最长子字符串


https://leetcode-cn.com/problems/wtcaE1/solution/shua-chuan-jian-zhi-offer-day09-zi-fu-ch-tb4t/

难度:中等


题目:

给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。

提示:

  • 0 <= s.length <= 5 * 10 ^ 4
  • s 由英文字母、数字、符号和空格组成


示例:

示例1:
输入: s = "abcabcbb"
输出: 3 
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:
输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
示例 3:
输入: s = "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是"wke",所以其长度为 3。
    请注意,你的答案必须是 子串 的长度,"pwke"是一个子序列,不是子串。
示例 4:
输入: s = ""
输出: 0


分析:

这道题同样是通过滑动窗口来解题,只不过这次的边界获取要通过哈希表来实现。

  1. 首先我们创建一个哈希表calc,并且初始化左边界left = 0,默认返回值ret = 0
  2. 下来我们从0开始遍历字符串
  3. 每当遍历到字符串中的一个字符时,首先需要判断该字符是否在哈希表calc中
  4. 如果该字符串没有在哈希表中,表示该字符不重复,无需移动左边界,将该字符串及对应下标加入哈希表中
  5. 如果该字符存在哈希表中,表示找到了重复的元素,此时我们需要移动左边界left
  • 若left小于哈希表中该字符对应的index下标,则移动至index + 1(因为index已经重复了,需要跳过)
  • 若left大于哈希表中该字符对应的index下标,表示重复的内容在左边界以外,忽略即可
  • 将当前字符串对应的下标更新哈希表中该字符串对应的下标
  1. 每次更新左边界后,比较当前滑窗长度与返回值大小并更新返回值
  2. 最终返回ret即可。


解题:


Python:

class Solution:
    def lengthOfLongestSubstring(self, s):
        calc = {}
        left = 0
        ret = 0
        for i, j in enumerate(s):
            if j in calc:
                # 如果重复的数字出现在l之前忽略,否则了跳到该值的下一个位置
                left = max(left, calc[j] + 1)
            calc[j] = i
            ret = max(ret, i - left + 1)
        return ret


Java:

class Solution {
    public int lengthOfLongestSubstring(String s) {
        HashMap<Character, Integer> calc = new HashMap<>();
        int left = 0;
        int ret = 0;
        for (int i = 0; i < s.length(); i++) {
            if (calc.get(s.charAt(i)) != null) {
                left = Math.max(left, calc.get(s.charAt(i)) + 1);
            }
            calc.put(s.charAt(i), i);
            ret = Math.max(ret, i - left + 1);
        }
        return ret;
    }
}

关于字符串的哈希表解题方式就讨论到这里,如果学有余力的朋友,可以看看017.含有所有字符的最短字符串,这是一道困难题,如果初学的朋友可以先放放,等完整学过哈希表这章节后再来做这道题会比较轻松写。

今天的文章就到这里,还是那句老话,编程是敲出来的,不是看出来的。看过文章一定要实操一遍,切记这样才能学好!



相关文章
|
3天前
【每日一题Day143】面试题 17.05. 字母与数字 | 前缀和+哈希表
【每日一题Day143】面试题 17.05. 字母与数字 | 前缀和+哈希表
24 0
|
11月前
|
C++
C/C++ leetcode刷题的各种小tips记录
C/C++ leetcode刷题的各种小tips记录
114 0
力扣刷题记录——709. 转换成小写字母、771. 宝石与石头、704. 二分查找
力扣刷题记录——709. 转换成小写字母、771. 宝石与石头、704. 二分查找
力扣刷题记录——709. 转换成小写字母、771. 宝石与石头、704. 二分查找
力扣刷题记录——459.重复的字符串、461. 汉明距离、476. 数字的补数
力扣刷题记录——459.重复的字符串、461. 汉明距离、476. 数字的补数
118 0
力扣刷题记录——459.重复的字符串、461. 汉明距离、476. 数字的补数
力扣刷题记录——392. 判断子序列、401. 二进制手表、409.最长回文串
力扣刷题记录——392. 判断子序列、401. 二进制手表、409.最长回文串
力扣刷题记录——392. 判断子序列、401. 二进制手表、409.最长回文串
|
存储 算法
刷 整数反转 | 刷题打卡
刷 整数反转 | 刷题打卡
63 0
|
算法
【刷算法】字符串的全排列
【刷算法】字符串的全排列
|
机器学习/深度学习
力扣第41刷-重复的子字符串
力扣第41刷-重复的子字符串
力扣第41刷-重复的子字符串
【刷题记录】14.最长公共前缀
【刷题记录】14.最长公共前缀
120 0
【刷题记录】14.最长公共前缀