【力扣算法03】之正则表达式匹配- python

简介: 【力扣算法03】之正则表达式匹配- python

问题描述


给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘’ 的正则表达式匹配。
‘.’ 匹配任意单个字符
'
’ 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例2

输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例3

输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。

提示

  • 1 <= s.length <= 20
  • 1 <= p.length <= 20
  • s 只包含从 a-z 的小写字母。
  • p 只包含从 a-z 的小写字母,以及字符 . 和 *。
  • 保证每次出现字符 * 时,前面都匹配到有效的字符


思路分析

首先, 创建一个二维数组dp,其中dp[i][j]表示字符串s的前i个字符与模式p的前j个字符是否匹配。

初始化dp[0][0]True,因为空字符串与空模式是匹配的。

接下来, 需要填充数组dp的其他值。我们使用两个嵌套的循环来遍历字符串s和模式p的每个字符。

对于每个位置(i, j),我们考虑几种情况:

  1. 如果模式p的当前字符p[j-1]不是*,我们只需要判断字符串s的当前字符s[i-1]和模式p的当前字符p[j-1]是否匹配。如果相等,或者p[j-1].通配符,我们可以将dp[i][j]设置为dp[i-1][j-1],表示前缀字符串匹配。
  2. 如果模式p的当前字符p[j-1]*,我们需要考虑两种情况:
  • *代表0个前面的字符。在这种情况下,我们将dp[i][j]设置为dp[i][j-2],表示模式p中的p[j-2]p[j-1]被忽略。
  • *代表多个前面的字符。我们需要检查字符串s的当前字符s[i-1]和模式p的前一个字符p[j-2]是否匹配。如果匹配,我们可以将dp[i][j]设置为dp[i-1][j],表示可以将当前字符*匹配到字符串s的前一个字符。

最终,返回dp[m][n]的值,其中m为字符串s的长度,n为模式p的长度。如果dp[m][n]True,则表示整个字符串s与模式p匹配;否则,不匹配。


代码分析


def isMatch(self, s: str, p: str) -> bool:
    m = len(s)
    n = len(p)
    dp = [[False] * (n + 1) for _ in range(m + 1)]
    dp[0][0] = True
  • 首先,我们定义了一个isMatch函数,接受两个参数sp,分别表示字符串和模式。
  • 然后,我们获取字符串s和模式p的长度,并创建大小为(m+1) x (n+1)的二维数组dp,并将所有元素初始化为False
  • 初始化dp[0][0]True,因为空字符串与空模式是匹配的。
for i in range(m + 1):
        for j in range(1, n + 1):
            if p[j - 1] != '*':
                if i > 0 and (s[i - 1] == p[j - 1] or p[j - 1] == '.'):
                    dp[i][j] = dp[i - 1][j - 1]
            else:
                if j >= 2:
                    dp[i][j] = dp[i][j - 2]
                    if i > 0 and (s[i - 1] == p[j - 2] or p[j - 2] == '.'):
                        dp[i][j] |= dp[i - 1][j]
  • 使用两层循环遍历字符串s和模式p的每个字符。
  • 对于每个位置(i, j),我们分情况讨论:
  • 如果模式p的当前字符p[j-1]不是*,且字符串s的当前字符s[i-1]与模式p的当前字符p[j-1]匹配(或者p[j-1].通配符),则将dp[i][j]设置为dp[i-1][j-1],表示前缀字符串匹配。
  • 如果模式p的当前字符p[j-1]*,我们需要进一步分情况讨论:
  • *代表0个前面的字符:设置dp[i][j]dp[i][j-2],表示模式p中的p[j-2]p[j-1]被忽略。
  • *代表多个前面的字符:首先设置dp[i][j]dp[i][j-2],然后判断字符串s的当前字符s[i-1]与模式p的前一个字符p[j-2]是否匹配。如果匹配,就将dp[i][j]更新为dp[i-1][j]的值。
return dp[m][n]
  • 最后,返回dp[m][n]的值,即表示整个字符串s与模式p是否匹配。

完整代码


class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        # 获取字符串s和模式p的长度
        m, n = len(s), len(p)
        # 创建一个二维dp数组来存储匹配结果,默认为False
        dp = [[False] * (n + 1) for _ in range(m + 1)]
        # 初始化dp[0][0]为True,表示空字符串与空模式匹配
        dp[0][0] = True
        for i in range(m + 1):
            for j in range(1, n + 1):
                if p[j - 1] != '*':
                    # 当前字符不是'*'时,比较s的第i个字符和p的第j个字符是否匹配
                    if i > 0 and (s[i - 1] == p[j - 1] or p[j - 1] == '.'):
                        dp[i][j] = dp[i - 1][j - 1]
                else:
                    # 当前字符是'*'时,分两种情况考虑
                    # 第一种情况:忽略p的前两个字符(即'*'前面的字符)
                    if j >= 2:
                        dp[i][j] = dp[i][j - 2]
                    # 第二种情况:如果s的第i个字符和p的前两个字符匹配,
                    # 或者p的前两个字符是'.',则可以考虑将s的第i个字符加入匹配模式中
                    if i >= 1 and j >= 2 and (s[i - 1] == p[j - 2] or p[j - 2] == '.'):
                        dp[i][j] = dp[i][j] or dp[i - 1][j]
        # 返回匹配结果
        return dp[m][n]

运行效果及示例代码


示例代码1


solution = Solution()
print(solution.isMatch("aa", "a"))

运行结果

示例代码2

solution = Solution()
print(solution.isMatch("aa", "a*")) 

运行结果

示例代码3

solution = Solution()
print(solution.isMatch("ab", ".*"))  

运行结果


完结


相关文章
|
4天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
4天前
|
算法 机器人 Python
Python实现教程:平面最短路径算法
Python实现教程:平面最短路径算法
12 1
|
5天前
|
存储 算法
Leetcode 30天高效刷数据结构和算法 Day1 两数之和 —— 无序数组
给定一个无序整数数组和目标值,找出数组中和为目标值的两个数的下标。要求不重复且可按任意顺序返回。示例:输入nums = [2,7,11,15], target = 9,输出[0,1]。暴力解法时间复杂度O(n²),优化解法利用哈希表实现,时间复杂度O(n)。
16 0
|
10天前
|
机器学习/深度学习 运维 算法
【Python机器学习专栏】异常检测算法在Python中的实践
【4月更文挑战第30天】本文介绍了异常检测的重要性和在不同领域的应用,如欺诈检测和网络安全。文章概述了四种常见异常检测算法:基于统计、距离、密度和模型的方法。在Python实践中,使用scikit-learn库展示了如何实现这些算法,包括正态分布拟合、K-means聚类、局部异常因子(LOF)和孤立森林(Isolation Forest)。通过计算概率密度、距离、LOF值和数据点的平均路径长度来识别异常值。
|
10天前
|
机器学习/深度学习 数据可视化 算法
【Python机器学习专栏】t-SNE算法在数据可视化中的应用
【4月更文挑战第30天】t-SNE算法是用于高维数据可视化的非线性降维技术,通过最小化Kullback-Leibler散度在低维空间保持数据点间关系。其特点包括:高维到二维/三维映射、保留局部结构、无需预定义簇数量,但计算成本高。Python中可使用`scikit-learn`的`TSNE`类实现,结合`matplotlib`进行可视化。尽管计算昂贵,t-SNE在揭示复杂数据集结构上极具价值。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】关联规则学习:Apriori算法详解
【4月更文挑战第30天】Apriori算法是一种用于关联规则学习的经典算法,尤其适用于购物篮分析,以发现商品间的购买关联。该算法基于支持度和置信度指标,通过迭代生成频繁项集并提取满足阈值的规则。Python中可借助mlxtend库实现Apriori,例如处理购物篮数据,设置支持度和置信度阈值,找出相关规则。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】层次聚类算法的原理与应用
【4月更文挑战第30天】层次聚类是数据挖掘中的聚类技术,无需预设簇数量,能生成数据的层次结构。分为凝聚(自下而上)和分裂(自上而下)两类,常用凝聚层次聚类有最短/最长距离、群集平均和Ward方法。优点是自动确定簇数、提供层次结构,适合小到中型数据集;缺点是计算成本高、过程不可逆且对异常值敏感。在Python中可使用`scipy.cluster.hierarchy`进行实现。尽管有局限,层次聚类仍是各领域强大的分析工具。
|
10天前
|
机器学习/深度学习 算法 数据挖掘
【Python 机器学习专栏】K-means 聚类算法在 Python 中的实现
【4月更文挑战第30天】K-means 是一种常见的聚类算法,用于将数据集划分为 K 个簇。其基本流程包括初始化簇中心、分配数据点、更新簇中心并重复此过程直到收敛。在 Python 中实现 K-means 包括数据准备、定义距离函数、初始化、迭代和输出结果。虽然算法简单高效,但它需要预先设定 K 值,且对初始点选择敏感,可能陷入局部最优。广泛应用在市场分析、图像分割等场景。理解原理与实现对应用聚类分析至关重要。
|
10天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习算法的原理与应用
【4月更文挑战第30天】集成学习通过组合多个基学习器提升预测准确性,广泛应用于分类、回归等问题。主要步骤包括生成基学习器、训练和结合预测结果。算法类型有Bagging(如随机森林)、Boosting(如AdaBoost)和Stacking。Python中可使用scikit-learn实现,如示例代码展示的随机森林分类。集成学习能降低模型方差,缓解过拟合,提高预测性能。
|
10天前
|
机器学习/深度学习 算法 Python
【Python 机器学习专栏】随机森林算法的性能与调优
【4月更文挑战第30天】随机森林是一种集成学习方法,通过构建多棵决策树并投票或平均预测结果,具有高准确性、抗过拟合、处理高维数据的能力。关键性能因素包括树的数量、深度、特征选择和样本大小。调优方法包括调整树的数量、深度,选择关键特征和参数优化。Python 示例展示了使用 GridSearchCV 进行调优。随机森林广泛应用于分类、回归和特征选择问题,是机器学习中的重要工具。