高效搜索技巧:最小覆盖子串解法【力扣75题 python】

简介: 高效搜索技巧:最小覆盖子串解法【力扣75题 python】

作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。

会一些的技术:数据分析、算法、SQL、大数据相关、python

欢迎加入社区:码上找工作

作者专栏每日更新:

LeetCode解锁1000题: 打怪升级之旅

python数据分析可视化:企业实战案例

python源码解读

备注说明:方便大家阅读,统一使用python,带必要注释,公众号 数据分析螺丝钉 一起打怪升级

题目描述

给你一个字符串 s、一个字符串 t。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复的字符,我们希望在 s 的子串中也有相应数量的这些字符。
  • 如果有多个满足条件的子串,返回任意一个即可。
输入格式
  • s:源字符串。
  • t:需要被覆盖的目标字符串。
输出格式
  • 返回满足条件的最小子串,如果不存在则返回空字符串。

示例

示例 1
输入: s = "ADOBECODEBANC", t = "ABC"
输出: "BANC"
示例 2
输入: s = "a", t = "a"
输出: "a"

方法一:滑动窗口

解题步骤
  1. 初始化两个字典:一个用于记录 t 中各字符的数量,一个用于记录当前窗口中各字符的数量。
  2. 使用两个指针表示窗口leftright 表示窗口的左右边界。
  3. 扩展右边界:移动 right 以包括更多的字符。
  4. 收缩左边界:当窗口包含所有 t 的字符后,尝试移动 left 缩小窗口直到窗口不再满足条件。
  5. 记录最小窗口:在收缩窗口时更新最小窗口大小。
完整的规范代码
def minWindow(s, t):
    """
    使用滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    window = {}
    
    have, need = 0, len(t_count)
    left, right = 0, 0
    res, res_len = [-1, -1], float('inf')
    while right < len(s):
        character = s[right]
        window[character] = window.get(character, 0) + 1
        
        if character in t_count and window[character] == t_count[character]:
            have += 1
        
        while have == need:
            # 更新结果
            if (right - left + 1) < res_len:
                res = [left, right]
                res_len = right - left + 1
            # 尝试收缩窗口
            window[s[left]] -= 1
            if s[left] in t_count and window[s[left]] < t_count[s[left]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储 t_countwindow

方法二:优化滑动窗口

解题步骤
  1. 跳跃式扩展:仅当遇到 t 中的字符时扩展窗口,跳过 s 中不在 t 中的字符。
  2. 有效收缩:当窗口满足条件时,尽量收缩窗口直到不满足条件。
完整的规范代码
def minWindow(s, t):
    """
    使用优化的滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    filtered_s = [(i, s[i]) for i in range(len(s)) if s[i] in t_count]
    
    left, right = 0, 0
    have, need = 0, len(t_count)
    window = {}
    res, res_len = [-1, -1], float('inf')
    while right < len(filtered_s):
        character = filtered_s[right][1]
        window[character] = window.get(character, 0) + 1
        
        if window[character] == t_count[character]:
            have += 1
        
        while have == need:
            start, end = filtered_s[left][0], filtered_s[right][0]
            if (end - start + 1) < res_len:
                res = [start, end]
                res_len = end - start + 1
            window[filtered_s[left][1]] -= 1
            if window[filtered_s[left][1]] < t_count[filtered_s[left][1]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n + m)),其中 n 是字符串 s 的长度,m 是字符串 t 的长度。
  • 空间复杂度:(O(m)),用于存储 t_countwindow,加上 filtered_s 的空间,取决于 ts 中的字符数量。

方法三:优化数据结构

解题步骤
  1. 使用数组优化:使用数组代替哈希表来优化存储,因为字符集是有限的。
  2. 同方法一,但使用数组进行字符计数。
完整的规范代码
def minWindow(s, t):
    """
    使用数组优化滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    s_count = [0] * 128
    need = len(t_count)
    have = 0
    
    left, right = 0, 0
    res, res_len = [-1, -1], float('inf')
    while right < len(s):
        s_count[ord(s[right])] += 1
        if s[right] in t_count and s_count[ord(s[right])] == t_count[s[right]]:
            have += 1
        
        while have == need:
            if (right - left + 1) < res_len:
                res = [left, right]
                res_len = right - left + 1
            s_count[ord(s[left])] -= 1
            if s[left] in t_count and s_count[ord(s[left])] < t_count[s[left]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(1)),数组的大小固定为字符集的大小,通常认为是常数。

方法四:双端队列优化

解题步骤
  1. 使用双端队列:使用队列存储满足条件的字符索引,快速定位和更新窗口的边界。
  2. 队列操作:在扩展和收缩窗口时,更新队列来快速响应窗口的变化。
完整的规范代码
from collections import deque
def minWindow(s, t):
    """
    使用双端队列优化滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    t_count = Counter(t)
    window = {}
    queue = deque()
    have, need = 0, len(t_count)
    res, res_len = "", float('inf')
    for i, char in enumerate(s):
        if char in t_count:
            queue.append(i)
            window[char] = window.get(char, 0) + 1
            if window[char] == t_count[char]:
                have += 1
            while queue and have == need:
                if (queue[-1] - queue[0] + 1) < res_len:
                    res = s[queue[0]:queue[-1]+1]
                    res_len = queue[-1] - queue[0] + 1
                left_char = s[queue.popleft()]
                window[left_char] -= 1
                if window[left_char] < t_count[left_char]:
                    have -= 1
    return res
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储窗口和队列。

方法五:动态规划扩展

解题步骤
  1. 动态规划思路:使用动态规划技术记录窗口内字符出现频率,并动态更新最小覆盖子串。
  2. 状态转移:状态转移方程考虑当前字符是否可以形成新的最小窗口。
完整的规范代码
def minWindow(s, t):
    """
    使用动态规划扩展解决最小覆盖子串问题
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import defaultdict
    t_count = Counter(t)
    window = defaultdict(int)
    have, need = 0, len(t_count)
    res, res_len = "", float('inf')
    left = 0
    for right in range(len(s)):
        window[s[right]] += 1
        if s[right] in t_count and window[s[right]] == t_count[s[right]]:
            have += 1
        
        while have == need:
            if (right - left + 1) < res_len:
                res = s[left:right+1]
                res_len = right - left + 1
            window[s[left]] -= 1
            if s[left] in t_count and window[s[left]] < t_count[s[left]]:
                have -= 1
            left += 1
    return res
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储窗口状态。

不同算法的优劣势对比

特征 方法一:滑动窗口 方法二:优化滑动窗口 方法三:优化数据结构 方法四:双端队列优化 方法五:动态规划扩展
时间复杂度 (O(n)) (O(n + m)) (O(n)) (O(n)) (O(n))
空间复杂度 (O(m)) (O(m)) (O(1)) (O(m)) (O(m))
优势 直观,易实现 减少无关字符处理 空间占用最小 高效更新窗口 状态记录,灵活调整
劣势 空间复杂度相对高 实现复杂 实现复杂 空间利用较高 实现最为复杂

应用示例

文本分析:在文本分析和自然语言处理中,找出包含指定词汇集的最短句子或段落非常有用,可以应用上述算法。

关键词高亮:在文档编辑或网页浏览中,快速找到并高亮显示包含所有关键词的最小文本块。

数据库查询优化:在处理大规模文本数据库查询时,快速确定包含多个搜索条件的最小文本区域,提高查询效率和响应速度。

欢迎关注微信公众号 数据分析螺丝钉

相关文章
|
7天前
|
Python
二分查找变种大赏!Python 中那些让你效率翻倍的搜索绝技!
二分查找是一种高效的搜索算法,适用于有序数组。其基本原理是通过不断比较中间元素来缩小搜索范围,从而快速找到目标值。常见的变种包括查找第一个等于目标值的元素、最后一个等于目标值的元素、第一个大于等于目标值的元素等。这些变种在实际应用中能够显著提高搜索效率,适用于各种复杂场景。
25 9
|
8天前
|
算法 数据处理 开发者
超越传统:Python二分查找的变种策略,让搜索效率再上新台阶!
本文介绍了二分查找及其几种Python实现的变种策略,包括经典二分查找、查找第一个等于给定值的元素、查找最后一个等于给定值的元素以及旋转有序数组的搜索。通过调整搜索条件和边界处理,这些变种策略能够适应更复杂的搜索场景,提升搜索效率和应用灵活性。
23 5
|
1月前
|
算法 索引
LeetCode(搜索插入位置)
如何使用二分查找算法来解决LeetCode上的“搜索插入位置”问题,确保时间复杂度为O(log n),并提供了详细的代码实现和分析。
14 2
|
1月前
|
索引
Leetcode第三十三题(搜索旋转排序数组)
这篇文章介绍了解决LeetCode第33题“搜索旋转排序数组”的方法,该问题要求在旋转过的升序数组中找到给定目标值的索引,如果存在则返回索引,否则返回-1,文章提供了一个时间复杂度为O(logn)的二分搜索算法实现。
18 0
Leetcode第三十三题(搜索旋转排序数组)
|
2月前
|
大数据 UED 开发者
实战演练:利用Python的Trie树优化搜索算法,性能飙升不是梦!
在数据密集型应用中,高效搜索算法至关重要。Trie树(前缀树/字典树)通过优化字符串处理和搜索效率成为理想选择。本文通过Python实战演示Trie树构建与应用,显著提升搜索性能。Trie树利用公共前缀减少查询时间,支持快速插入、删除和搜索。以下为简单示例代码,展示如何构建及使用Trie树进行搜索与前缀匹配,适用于自动补全、拼写检查等场景,助力提升应用性能与用户体验。
54 2
|
1月前
【LeetCode 39】700.二叉搜索树中的搜索
【LeetCode 39】700.二叉搜索树中的搜索
14 0
|
3月前
|
算法
LeetCode第81题搜索旋转排序数组 II
文章讲解了LeetCode第81题"搜索旋转排序数组 II"的解法,通过二分查找算法并加入去重逻辑来解决在旋转且含有重复元素的数组中搜索特定值的问题。
LeetCode第81题搜索旋转排序数组 II
|
3月前
|
安全 应用服务中间件 网络安全
Python 渗透测试:漏洞的批量搜索与利用.(GlassFish 任意文件读取)
Python 渗透测试:漏洞的批量搜索与利用.(GlassFish 任意文件读取)
54 11
|
3月前
|
算法
LeetCode第74题搜索二维矩阵
文章讲解了LeetCode第74题"搜索二维矩阵"的解决方案,利用二分搜索法将问题简化,并通过数学转换找到二维矩阵中的对应元素,展示了将二维问题转化为一维问题的解题技巧。
LeetCode第74题搜索二维矩阵
|
3月前
|
算法
LeetCode第35题搜索插入位置
这篇文章介绍了LeetCode第35题"搜索插入位置"的解题方法,通过使用二分查找法,高效地找到在有序数组中插入一个目标数的最佳位置。
LeetCode第35题搜索插入位置