字符串匹配——kmp算法

简介: 字符串匹配——kmp算法

在文本串(text)中找模式串(pattern)时,如果用暴力查找基本是时间复杂度是(n*m),以i,j分别标志文本串、模式串当前匹配位置,如果text[i]和pattern[j]不等,pattern就要从头比较,实际上模式串的j前面的已经匹配好了,这样就比较浪费信息。

如果j的前几位和pattern开头的前几位相同,那这几位可以不用再比较,而kmp算法正是应用了这个特性,找到pattern当前j位置前几位和pattern开始几位相同的最大个数,减少了比较时间。

怎样描述一下这个最大个数,用一个next数组,next[j]表示pattern字符串第j位前前几位和pattern前几位相同的最大个数。

所以kmp算法的关键就是求一下模式串next数组。

next数组求解的思路是利用已知信息进行递归。

已知i前面的next值,现在看第i+1位,前面最大相等数值位next[i],现在后缀添加了一个字母pattern[i+1],如果前面i最大前缀前缀后一位字母pattern[next[i]]同它相等,显然next[i+1]=next[i]+1;但是不等怎么办!我们要寻找最大相等个数为k,则现在k已经小于next[i]了,我们有不妨找next[i]前面的最大相等位,另k=next[i],去找next[k]=next[i]+1,如此递归到找到或者k已经是起始位了为止。

根据这个思路:

代码如下:


#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=10001;
int next[maxn];//next 数组标记位置
void getnext(char s[],int len) {
  int j=-1;
  next[0]=-1;
  for(int i=1;i<len;i++)
  {
    while(j!=-1&&s[i]!=s[j+1])
    j=next[j];
    if(s[i]==s[j+1])
    j++;
    next[i]=j;
  }
}
int kmp(char text[],char pattern[]){
  int ans=0,j=-1,n=strlen(text),m=strlen(pattern);
  getnext(pattern,m);
  for(int i=0;i<n;i++)
  {
    while(j!=-1&&text[i]!=pattern[j+1])
    j=next[j];
    if(text[i]==pattern[j+1])
    j++;
    if(j==m-1){
      ans++;
      j=next[j];
    }
  }
    return ans;
}
int main(){
  char a[]="ababab",b[]="ab";
  int k=kmp(a,b);
  cout<<k;
  return 0;
}
相关文章
|
2月前
|
算法
【优选算法】—— 字符串匹配算法
【优选算法】—— 字符串匹配算法
|
22天前
|
算法
代码随想录算法训练营第五十五天 | LeetCode 583. 两个字符串的删除操作、72. 编辑距离、编辑距离总结
代码随想录算法训练营第五十五天 | LeetCode 583. 两个字符串的删除操作、72. 编辑距离、编辑距离总结
24 1
|
26天前
|
存储 算法
图解Kmp算法——配图详解(超级详细)
图解Kmp算法——配图详解(超级详细)
|
1月前
|
算法 测试技术 C#
【字典树】【KMP】【C++算法】3045统计前后缀下标对 II
【字典树】【KMP】【C++算法】3045统计前后缀下标对 II
|
1月前
|
算法
KMP算法 与 strstr()函数
KMP算法 与 strstr()函数
|
1月前
|
算法
【算法学习--字符串】(不含KMP算法)
【算法学习--字符串】(不含KMP算法)
|
22小时前
|
算法 数据安全/隐私保护 计算机视觉
基于二维CS-SCHT变换和LABS方法的水印嵌入和提取算法matlab仿真
该内容包括一个算法的运行展示和详细步骤,使用了MATLAB2022a。算法涉及水印嵌入和提取,利用LAB色彩空间可能用于隐藏水印。水印通过二维CS-SCHT变换、低频系数处理和特定解码策略来提取。代码段展示了水印置乱、图像处理(如噪声、旋转、剪切等攻击)以及水印的逆置乱和提取过程。最后,计算并保存了比特率,用于评估水印的稳健性。
|
1天前
|
存储 算法 数据可视化
基于harris角点和RANSAC算法的图像拼接matlab仿真
本文介绍了使用MATLAB2022a进行图像拼接的流程,涉及Harris角点检测和RANSAC算法。Harris角点检测寻找图像中局部曲率变化显著的点,RANSAC则用于排除噪声和异常点,找到最佳匹配。核心程序包括自定义的Harris角点计算函数,RANSAC参数设置,以及匹配点的可视化和仿射变换矩阵计算,最终生成全景图像。
|
1天前
|
算法 Serverless
m基于遗传优化的LDPC码NMS译码算法最优归一化参数计算和误码率matlab仿真
MATLAB 2022a仿真实现了遗传优化的归一化最小和(NMS)译码算法,应用于低密度奇偶校验(LDPC)码。结果显示了遗传优化的迭代过程和误码率对比。遗传算法通过选择、交叉和变异操作寻找最佳归一化因子,以提升NMS译码性能。核心程序包括迭代优化、目标函数计算及性能绘图。最终,展示了SNR与误码率的关系,并保存了关键数据。
11 1
|
3天前
|
算法 调度
考虑需求响应的微网优化调度模型【粒子群算法】【matlab】
考虑需求响应的微网优化调度模型【粒子群算法】【matlab】