KMP 字符串匹配算法

简介: ✅<1>主页:C语言的前男友📃<2>知识讲解:KMP算法🔥<3>创作者:C语言的前男友☂️<4>开发环境:Visual Studio 2022🏡<5>系统环境:Windows 10💬<6>前言:KMP 算法是一个非常牛逼的字符串匹配算法

一.KMP算法介绍

KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。—— 百度百科


二.为什么存在 next 数组

普通的 BF 算法,存在大量的多余匹配,为了减少模式串与主串的匹配次数以达到快速匹配的目的。来优化 BF 算法里面匹配失败后,将子串从头开始与模式匹配的问题。在实际的匹配当中,当模式串与子串匹配失败的时候,有很多的情况子串是不需要从头开始跟模式串匹配的。只需要退回到一个特定的位置。next数组就是一个长度跟子串的长度一样,数组中存储子串中每个字符在匹配失败后,需要退回的位置的数组。


当有了 next 数组,当子串与模式串匹配失败后,子串无需从最开始的位置与模式串匹配,只需从 next 数组中存储的位置开始再次与模式串匹配。


三.子串退回位置的求解


e206d2d13ca84856adb53934cb67a757.png


其中我们将在子串第一个字符匹配失败退回位置记作 -1,在第二个字符匹配失败退回记作 0 。


这样根据上述方法就能求解出,子串每个位置匹配失败后的退回位置,将每个字符匹配失败后的退回位置放在一个长度与子串长度相等数组中,这个数组就是 next 数组。


9b4ebc0a342041dfb85628c93593475a.png


四.next数组的代码求解:

第一种情况:

在求 next 数组的时候,当前位置 i 匹配失败后,k 代表退回的位置,如果 k 所在的位置的字符,与 i 所在位置的字符相等时,则 i+1 位置匹配失败后,退回的位置就是,k+1;


c692605e5c16444fb3dd09e56255ba95.png


第二种情况:

当前位置 i 匹配失败后,k 代表退回的位置,如果 k 所在的位置的字符,与 i 所在位置的字符不相等时,此时,就需要 k 继续按照当前位置的继续回退,直到回退到,k 位置的字符与 i 位置的字符相等,或者 k==-1.这个时候就回到了,第一种情况。


4d16a776496c441794f6528691f8a6b7.png


五.代码实现及讲解:

代码:

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<string.h>
void GetNext(char* sub,int *next)
{
  int sublen = strlen(sub);
  int i = 2; // i 从数组子串第三个元素开始
  int k = 0; // 代表回退的位置,k的位置始终位于,i - 1 匹配失败的回退位置的对应的 k,
             // 即可由 i - 1 位置求出 的 k,求出 i 位置的 k。
  next[0] = -1;
  next[1] = 0;
  while (i<sublen)
  {
    //当 k 回退到头的时候 即 k==-1,就需要回退到 0 号下标位置,
    //或者 如果 退回位置字符和匹配失败的字符相同
    if (k == -1 || sub[i - 1] == sub[k])
    {
      next[i] = k + 1;
      //已经求出 i 的退回位置,i 继续往后走
      i++;
      // k 要变成新的 i-1 位置的退回位置。
      k++;
    }
    //如果 退回位置字符和匹配失败的字符不相同
    else
    {
      // k 在当前位置继续回退
      k = next[k];
    }
  }
}
int KMP(char* str, char* sub, int pos)
{
  assert(str && sub);
  int StrLen = strlen(str);
  int SubLen = strlen(sub);
  assert(pos >= 0&&pos<StrLen);
  //创建 next 数组
    int * next = (int*)malloc(sizeof(int)*SubLen);
  int i = pos; //主串
  int j = 0;   //子串
  //构建next数组
  GetNext(sub,next);
  //主串和子串匹配
  while (i < StrLen && j < SubLen)
  {
    //如果匹配的字符相同就继续往后匹配
    if (j==-1 || str[i] == sub[j])
    {
      i++;
      j++;
    }
    //回退
    else
    {
      j = next[j];
    }
  }
  //当 j 遍历到最后时,也就是 子串全部匹配成功
  if (j >= SubLen)
  {
    return i - j;
  }
  //模式串与子串匹配失败
  return -1;
}

测试:


六.最后

不经一番寒彻骨,怎得梅花扑鼻香。


 

相关文章
|
4月前
|
存储 机器学习/深度学习 算法
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty 敏感词
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty 敏感词
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty  敏感词
|
3月前
|
机器学习/深度学习 监控 算法
局域网行为监控软件 C# 多线程数据包捕获算法:基于 KMP 模式匹配的内容分析优化方案探索
本文探讨了一种结合KMP算法的多线程数据包捕获与分析方案,用于局域网行为监控。通过C#实现,该系统可高效检测敏感内容、管理URL访问、分析协议及审计日志。实验表明,相较于传统算法,KMP在处理大规模网络流量时效率显著提升。未来可在算法优化、多模式匹配及机器学习等领域进一步研究。
81 0
|
11月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
221 1
两个字符串匹配出最长公共子序列算法
|
11月前
|
算法
第四章 KMP算法理论基础
第四章 KMP算法理论基础
148 0
|
11月前
|
算法
KMP算法
KMP算法
103 0
|
算法 C++
A : DS串应用–KMP算法
这篇文章提供了KMP算法的C++实现,包括计算模式串的next数组和在主串中查找模式串位置的函数,用于演示KMP算法的基本应用。
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
算法
KMP算法
KMP算法
87 0
|
13天前
|
机器学习/深度学习 算法 新能源
【优化调度】基于matlab粒子群算法求解水火电经济调度优化问题研究(Matlab代码实现)
【优化调度】基于matlab粒子群算法求解水火电经济调度优化问题研究(Matlab代码实现)
|
14天前
|
算法 机器人 定位技术
基于机器视觉和Dijkstra算法的平面建筑群地图路线规划matlab仿真
本程序基于机器视觉与Dijkstra算法,实现平面建筑群地图的路径规划。通过MATLAB 2022A读取地图图像,识别障碍物并进行路径搜索,支持鼠标选择起点与终点,最终显示最优路径及长度,适用于智能导航与机器人路径规划场景。

热门文章

最新文章