剑指offer(C++)-JZ19:正则表达式匹配(算法-动态规划)

简介: 剑指offer(C++)-JZ19:正则表达式匹配(算法-动态规划)

题目描述:

请实现一个函数用来匹配包括'.'和'*'的正则表达式。


1.模式中的字符'.'表示任意一个字符


2.模式中的字符'*'表示它前面的字符可以出现任意次(包含0次)。


在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配


数据范围:


1.str 只包含从 a-z 的小写字母。


2.pattern 只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。


3. 0≤str.length≤26

4. 0≤pattern.length≤26

示例1:

输入:

"aaa","a*a"


返回值:

true

说明:

中间的*可以出现任意次的a,所以可以出现1次a,能匹配上

解题思路:

本题考察算法-动态规划算法的使用。具体思路如下:


1.建立动态规划表,s1行,s2列,表示进行到某个位置时的匹配状态,默认均为false。


2.初始化首位置为true。首列除了(0,0)位置全为false,首行有可能因为*字符而出现true的情况,所以要处理下。


3.先考虑不为*的情况,这类情况比较简单。当出现.符号或者字符相同时,当前位置匹配成功;若上一层判断是true,则表示整体匹配成功;若上一层为false,即使当前匹配成功,整体也是失败的。


4.再考虑有*符号的情况,这个要继续细分。A:*前的字符是.或者能与str对应位置字符一致。B:不一致。


5.A类情况,此时有两种可能使得匹配成功。


一是x*这两个字符等于空,字符x的数量当做0处理,只参考去除这两个字符后是否匹配成功,如下图所示。如果dp[i][j-2]是true,则true,是false则false。

二是将x字符重复匹配,其实上面的情况可以看做是0个b,若str中出现了连续的b,则连续匹配,匹配的依据就是dp[i-1][j]的状态,直到连续字符中断。如下图所示。

综合来看,A类场景的匹配依据就可以归纳为:dp[i-1][j]和dp[i][j-2]有一个是true,dp[i][j]就可以匹配成功。


6.A类场景搞懂了,B类自然不难理解。因为字符不一致了,所以只能把x*这两个字符当做空,再结合dp[i][j-2]的匹配状态来判断是否匹配成功。

7.以上就是完整思路,可以自己画个表,便于理解。

测试代码:

class Solution {
public:
    // 匹配
    bool match(string str, string pattern) {
        int s1 = str.length();
        int s2 = pattern.length();
        // 建立动态规划表
        // dp[i][j]表示str前i个字符是否与pattern前j个字符匹配
        vector<vector<bool>> dp(s1 + 1, vector<bool>(s2 + 1, false));
        // 双空串可匹配
        dp[0][0] = true;
        // 处理当str为空时的情况
        for(int j = 2; j <= s2; ++j)
        {
            if(pattern[j - 1] == '*')
            {
                dp[0][j] = dp[0][j - 2];
            }
        }
        // 双层循环
        for(int i = 1; i <= s1; ++i)
        {
            for(int j = 1; j <= s2; ++j)
            {
                // 考虑不为*的情况
                // 当出现.符号或者字符相同时,当前位置匹配成功
                // 若上一层判断是true,则表示整体匹配成功;若上一层为false,即使当前匹配成功,整体也是失败的
                if(pattern[j - 1] != '*' && (pattern[j - 1] == '.' || pattern[j - 1] == str[i - 1]))
                {
                    dp[i][j] = dp[i - 1][j - 1];
                }
                // 若出现*符号,则继续分情况考虑
                else if(j >= 2 && pattern[j - 1] == '*')
                {
                    // 若*前的字符是.或者能与str字符串的第i-1个字符一致,则进入该分支
                    if(pattern[j - 2] == '.' || pattern[j - 2] == str[i - 1])
                    {
                        // 如果dp[i][j-2]是true,并赋给dp[i][j],意味着x*这两个字符等于空,把字符x的数量当做0处理,此时匹配成功
                        // 如果dp[i][j-2]是false,说明前面的匹配链是断开的
                        // 但有一个机会能完成匹配,那就是*前面的字符和str中对应位置字符一致
                        // 但还需要dp[i-1][j]是true才行,它是true的条件其实就等同于字符x连续重复了多次
                        // 综上,dp[i-1][j]和dp[i][j-2]有一个是true,dp[i][j]就可以匹配成功
                        dp[i][j] = dp[i - 1][j] || dp[i][j - 2];
                    }
                    else
                    {
                        // 如果进入该分支,那说明*前的字符和str字符串的第i-1个字符不一致
                        // 不一致却能匹配成功的情况,就只能是x*这两个字符为空,也就是把字符x的数量当0处理
                        // 而dp[i][j-2]又是true才可以
                        dp[i][j] = dp[i][j - 2];
                    }
                }
            }
        }
        return dp[s1][s2];
    }
};


相关文章
|
25天前
|
机器学习/深度学习 存储 算法
动态规划算法深度解析:0-1背包问题
0-1背包问题是经典的组合优化问题,目标是在给定物品重量和价值及背包容量限制下,选取物品使得总价值最大化且每个物品仅能被选一次。该问题通常采用动态规划方法解决,通过构建二维状态表dp[i][j]记录前i个物品在容量j时的最大价值,利用状态转移方程避免重复计算子问题,从而高效求解最优解。
251 1
|
5月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
120 2
|
6月前
|
存储 算法 C++
Windows共享文件:探秘C++实现的B树索引算法奇境
在数字化时代,Windows共享文件的高效管理至关重要。B树算法以其自平衡多路搜索特性,在文件索引与存储优化中表现出色。本文探讨B树在Windows共享文件中的应用,通过C++实现具体代码,展示其构建文件索引、优化数据存储的能力,提升文件检索效率。B树通过减少磁盘I/O操作,确保查询高效,为企业和个人提供流畅的文件共享体验。
|
7月前
|
存储 负载均衡 算法
基于 C++ 语言的迪杰斯特拉算法在局域网计算机管理中的应用剖析
在局域网计算机管理中,迪杰斯特拉算法用于优化网络路径、分配资源和定位故障节点,确保高效稳定的网络环境。该算法通过计算最短路径,提升数据传输速率与稳定性,实现负载均衡并快速排除故障。C++代码示例展示了其在网络模拟中的应用,为企业信息化建设提供有力支持。
188 15
|
7月前
|
运维 监控 算法
解读 C++ 助力的局域网监控电脑网络连接算法
本文探讨了使用C++语言实现局域网监控电脑中网络连接监控的算法。通过将局域网的拓扑结构建模为图(Graph)数据结构,每台电脑作为顶点,网络连接作为边,可高效管理与监控动态变化的网络连接。文章展示了基于深度优先搜索(DFS)的连通性检测算法,用于判断两节点间是否存在路径,助力故障排查与流量优化。C++的高效性能结合图算法,为保障网络秩序与信息安全提供了坚实基础,未来可进一步优化以应对无线网络等新挑战。
|
7月前
|
存储 算法 数据处理
公司局域网管理中的哈希表查找优化 C++ 算法探究
在数字化办公环境中,公司局域网管理至关重要。哈希表作为一种高效的数据结构,通过哈希函数将关键值(如IP地址、账号)映射到数组索引,实现快速的插入、删除与查找操作。例如,在员工登录验证和设备信息管理中,哈希表能显著提升效率,避免传统线性查找的低效问题。本文以C++为例,展示了哈希表在局域网管理中的具体应用,包括设备MAC地址与IP分配的存储与查询,并探讨了优化哈希函数和扩容策略,确保网络管理高效准确。
|
3月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
93 0
|
4月前
|
存储 机器学习/深度学习 算法
基于 C++ 的局域网访问控制列表(ACL)实现及局域网限制上网软件算法研究
本文探讨局域网限制上网软件中访问控制列表(ACL)的应用,分析其通过规则匹配管理网络资源访问的核心机制。基于C++实现ACL算法原型,展示其灵活性与安全性。文中强调ACL在企业与教育场景下的重要作用,并提出性能优化及结合机器学习等未来研究方向。
114 4
|
5月前
|
监控 算法 数据处理
基于 C++ 的 KD 树算法在监控局域网屏幕中的理论剖析与工程实践研究
本文探讨了KD树在局域网屏幕监控中的应用,通过C++实现其构建与查询功能,显著提升多维数据处理效率。KD树作为一种二叉空间划分结构,适用于屏幕图像特征匹配、异常画面检测及数据压缩传输优化等场景。相比传统方法,基于KD树的方案检索效率提升2-3个数量级,但高维数据退化和动态更新等问题仍需进一步研究。未来可通过融合其他数据结构、引入深度学习及开发增量式更新算法等方式优化性能。
151 17
|
4月前
|
机器学习/深度学习 存储 算法
基于 C++ 布隆过滤器算法的局域网上网行为控制:URL 访问过滤的高效实现研究
本文探讨了一种基于布隆过滤器的局域网上网行为控制方法,旨在解决传统黑白名单机制在处理海量URL数据时存储与查询效率低的问题。通过C++实现URL访问过滤功能,实验表明该方法可将内存占用降至传统方案的八分之一,查询速度提升约40%,假阳性率可控。研究为优化企业网络管理提供了新思路,并提出结合机器学习、改进哈希函数及分布式协同等未来优化方向。
98 0

热门文章

最新文章