高效搜索技巧:最小覆盖子串解法【力扣75题 python】

简介: 高效搜索技巧:最小覆盖子串解法【力扣75题 python】

作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。

会一些的技术:数据分析、算法、SQL、大数据相关、python

欢迎加入社区:码上找工作

作者专栏每日更新:

LeetCode解锁1000题: 打怪升级之旅

python数据分析可视化:企业实战案例

python源码解读

备注说明:方便大家阅读,统一使用python,带必要注释,公众号 数据分析螺丝钉 一起打怪升级

题目描述

给你一个字符串 s、一个字符串 t。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复的字符,我们希望在 s 的子串中也有相应数量的这些字符。
  • 如果有多个满足条件的子串,返回任意一个即可。
输入格式
  • s:源字符串。
  • t:需要被覆盖的目标字符串。
输出格式
  • 返回满足条件的最小子串,如果不存在则返回空字符串。

示例

示例 1
输入: s = "ADOBECODEBANC", t = "ABC"
输出: "BANC"
示例 2
输入: s = "a", t = "a"
输出: "a"

方法一:滑动窗口

解题步骤
  1. 初始化两个字典:一个用于记录 t 中各字符的数量,一个用于记录当前窗口中各字符的数量。
  2. 使用两个指针表示窗口leftright 表示窗口的左右边界。
  3. 扩展右边界:移动 right 以包括更多的字符。
  4. 收缩左边界:当窗口包含所有 t 的字符后,尝试移动 left 缩小窗口直到窗口不再满足条件。
  5. 记录最小窗口:在收缩窗口时更新最小窗口大小。
完整的规范代码
def minWindow(s, t):
    """
    使用滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    window = {}
    
    have, need = 0, len(t_count)
    left, right = 0, 0
    res, res_len = [-1, -1], float('inf')
    while right < len(s):
        character = s[right]
        window[character] = window.get(character, 0) + 1
        
        if character in t_count and window[character] == t_count[character]:
            have += 1
        
        while have == need:
            # 更新结果
            if (right - left + 1) < res_len:
                res = [left, right]
                res_len = right - left + 1
            # 尝试收缩窗口
            window[s[left]] -= 1
            if s[left] in t_count and window[s[left]] < t_count[s[left]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储 t_countwindow

方法二:优化滑动窗口

解题步骤
  1. 跳跃式扩展:仅当遇到 t 中的字符时扩展窗口,跳过 s 中不在 t 中的字符。
  2. 有效收缩:当窗口满足条件时,尽量收缩窗口直到不满足条件。
完整的规范代码
def minWindow(s, t):
    """
    使用优化的滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    filtered_s = [(i, s[i]) for i in range(len(s)) if s[i] in t_count]
    
    left, right = 0, 0
    have, need = 0, len(t_count)
    window = {}
    res, res_len = [-1, -1], float('inf')
    while right < len(filtered_s):
        character = filtered_s[right][1]
        window[character] = window.get(character, 0) + 1
        
        if window[character] == t_count[character]:
            have += 1
        
        while have == need:
            start, end = filtered_s[left][0], filtered_s[right][0]
            if (end - start + 1) < res_len:
                res = [start, end]
                res_len = end - start + 1
            window[filtered_s[left][1]] -= 1
            if window[filtered_s[left][1]] < t_count[filtered_s[left][1]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n + m)),其中 n 是字符串 s 的长度,m 是字符串 t 的长度。
  • 空间复杂度:(O(m)),用于存储 t_countwindow,加上 filtered_s 的空间,取决于 ts 中的字符数量。

方法三:优化数据结构

解题步骤
  1. 使用数组优化:使用数组代替哈希表来优化存储,因为字符集是有限的。
  2. 同方法一,但使用数组进行字符计数。
完整的规范代码
def minWindow(s, t):
    """
    使用数组优化滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import Counter
    t_count = Counter(t)
    s_count = [0] * 128
    need = len(t_count)
    have = 0
    
    left, right = 0, 0
    res, res_len = [-1, -1], float('inf')
    while right < len(s):
        s_count[ord(s[right])] += 1
        if s[right] in t_count and s_count[ord(s[right])] == t_count[s[right]]:
            have += 1
        
        while have == need:
            if (right - left + 1) < res_len:
                res = [left, right]
                res_len = right - left + 1
            s_count[ord(s[left])] -= 1
            if s[left] in t_count and s_count[ord(s[left])] < t_count[s[left]]:
                have -= 1
            left += 1
        
        right += 1
    l, r = res
    return s[l:r+1] if res_len != float('inf') else ""
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(1)),数组的大小固定为字符集的大小,通常认为是常数。

方法四:双端队列优化

解题步骤
  1. 使用双端队列:使用队列存储满足条件的字符索引,快速定位和更新窗口的边界。
  2. 队列操作:在扩展和收缩窗口时,更新队列来快速响应窗口的变化。
完整的规范代码
from collections import deque
def minWindow(s, t):
    """
    使用双端队列优化滑动窗口寻找最小覆盖子串
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    t_count = Counter(t)
    window = {}
    queue = deque()
    have, need = 0, len(t_count)
    res, res_len = "", float('inf')
    for i, char in enumerate(s):
        if char in t_count:
            queue.append(i)
            window[char] = window.get(char, 0) + 1
            if window[char] == t_count[char]:
                have += 1
            while queue and have == need:
                if (queue[-1] - queue[0] + 1) < res_len:
                    res = s[queue[0]:queue[-1]+1]
                    res_len = queue[-1] - queue[0] + 1
                left_char = s[queue.popleft()]
                window[left_char] -= 1
                if window[left_char] < t_count[left_char]:
                    have -= 1
    return res
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储窗口和队列。

方法五:动态规划扩展

解题步骤
  1. 动态规划思路:使用动态规划技术记录窗口内字符出现频率,并动态更新最小覆盖子串。
  2. 状态转移:状态转移方程考虑当前字符是否可以形成新的最小窗口。
完整的规范代码
def minWindow(s, t):
    """
    使用动态规划扩展解决最小覆盖子串问题
    :param s: str, 源字符串
    :param t: str, 需要被覆盖的目标字符串
    :return: str, 满足条件的最小子串
    """
    from collections import defaultdict
    t_count = Counter(t)
    window = defaultdict(int)
    have, need = 0, len(t_count)
    res, res_len = "", float('inf')
    left = 0
    for right in range(len(s)):
        window[s[right]] += 1
        if s[right] in t_count and window[s[right]] == t_count[s[right]]:
            have += 1
        
        while have == need:
            if (right - left + 1) < res_len:
                res = s[left:right+1]
                res_len = right - left + 1
            window[s[left]] -= 1
            if s[left] in t_count and window[s[left]] < t_count[s[left]]:
                have -= 1
            left += 1
    return res
# 示例调用
print(minWindow("ADOBECODEBANC", "ABC"))  # 输出: "BANC"
print(minWindow("a", "a"))  # 输出: "a"
算法分析
  • 时间复杂度:(O(n)),其中 n 是字符串 s 的长度。
  • 空间复杂度:(O(m)),其中 m 是字符串 t 的长度,用于存储窗口状态。

不同算法的优劣势对比

特征 方法一:滑动窗口 方法二:优化滑动窗口 方法三:优化数据结构 方法四:双端队列优化 方法五:动态规划扩展
时间复杂度 (O(n)) (O(n + m)) (O(n)) (O(n)) (O(n))
空间复杂度 (O(m)) (O(m)) (O(1)) (O(m)) (O(m))
优势 直观,易实现 减少无关字符处理 空间占用最小 高效更新窗口 状态记录,灵活调整
劣势 空间复杂度相对高 实现复杂 实现复杂 空间利用较高 实现最为复杂

应用示例

文本分析:在文本分析和自然语言处理中,找出包含指定词汇集的最短句子或段落非常有用,可以应用上述算法。

关键词高亮:在文档编辑或网页浏览中,快速找到并高亮显示包含所有关键词的最小文本块。

数据库查询优化:在处理大规模文本数据库查询时,快速确定包含多个搜索条件的最小文本区域,提高查询效率和响应速度。

欢迎关注微信公众号 数据分析螺丝钉

相关文章
|
9天前
|
缓存 供应链 监控
1688item_search_factory - 按关键字搜索工厂数据接口深度分析及 Python 实现
item_search_factory接口专为B2B电商供应链优化设计,支持通过关键词精准检索工厂信息,涵盖资质、产能、地理位置等核心数据,助力企业高效开发货源、分析产业集群与评估供应商。
|
11天前
|
JSON 监控 数据格式
1688 item_search_app 关键字搜索商品接口深度分析及 Python 实现
1688开放平台item_search_app接口专为移动端优化,支持关键词搜索、多维度筛选与排序,可获取商品详情及供应商信息,适用于货源采集、价格监控与竞品分析,助力采购决策。
|
1月前
|
缓存 API 网络架构
淘宝item_search_similar - 搜索相似的商品API接口,用python返回数据
淘宝联盟开放平台中,可通过“物料优选接口”(taobao.tbk.dg.optimus.material)实现“搜索相似商品”功能。该接口支持根据商品 ID 获取相似推荐商品,并返回商品信息、价格、优惠等数据,适用于商品推荐、比价等场景。本文提供基于 Python 的实现示例,包含接口调用、数据解析及结果展示。使用时需配置淘宝联盟的 appkey、appsecret 和 adzone_id,并注意接口调用频率限制和使用规范。
|
12天前
|
缓存 供应链 监控
VVIC seller_search 排行榜搜索接口深度分析及 Python 实现
VVIC搜款网seller_search接口提供服装批发市场的商品及商家排行榜数据,涵盖热销榜、销量排名、类目趋势等,支持多维度筛选与数据分析,助力选品决策、竞品分析与市场预测,为服装供应链提供有力数据支撑。
|
30天前
|
机器学习/深度学习 算法 文件存储
神经架构搜索NAS详解:三种核心算法原理与Python实战代码
神经架构搜索(NAS)正被广泛应用于大模型及语言/视觉模型设计,如LangVision-LoRA-NAS、Jet-Nemotron等。本文回顾NAS核心技术,解析其自动化设计原理,探讨强化学习、进化算法与梯度方法的应用与差异,揭示NAS在大模型时代的潜力与挑战。
272 6
神经架构搜索NAS详解:三种核心算法原理与Python实战代码
|
20天前
|
Web App开发 缓存 监控
微店店铺商品搜索(item_search_shop)接口深度分析及 Python 实现
item_search_shop接口用于获取特定店铺的全部商品数据,支持批量获取商品列表、基础信息、价格、销量等,适用于竞品监控、商品归类及店铺分析等场景,助力全面了解店铺经营状况。
|
7天前
|
缓存 自然语言处理 算法
item_search - Lazada 按关键字搜索商品接口深度分析及 Python 实现
Lazada的item_search接口是关键词搜索商品的核心工具,支持多语言、多站点,可获取商品价格、销量、评分等数据,适用于市场调研与竞品分析。
|
2月前
|
测试技术 API 开发者
淘宝关键词搜索商品列表API接入指南(含Python示例)
淘宝关键词搜索商品列表API是淘宝开放平台的核心接口,支持通过关键词检索商品,适用于比价、选品、市场分析等场景。接口提供丰富的筛选与排序功能,返回结构化数据,含商品ID、标题、价格、销量等信息。开发者可使用Python调用,需注意频率限制与错误处理,建议先在沙箱环境测试。
|
3月前
|
数据采集 Web App开发 JavaScript
无头浏览器技术:Python爬虫如何精准模拟搜索点击
无头浏览器技术:Python爬虫如何精准模拟搜索点击
|
6月前
|
机器学习/深度学习 自然语言处理 TensorFlow
使用Python和DeepSeek进行联网搜索的实践指南
本文介绍如何使用Python和假设的高性能深度学习工具包DeepSeek进行联网搜索,并通过实际案例展示其应用过程。首先,准备环境并安装依赖库(如Python 3.x、pip、DeepSeek、requests和BeautifulSoup4)。接着,讲解了DeepSeek的功能及其在图像分类、实体识别等任务中的应用。通过联网搜索抓取数据并进行预处理后,使用TensorFlow和Keras构建和训练CNN模型。
672 3

推荐镜像

更多