KMP算法

简介: 算法系列

KMP算法

KMP算法是有三位计算机科学家 D.E.Knuth、J.H.Morris、V.R.Pratt提出,取自三人姓氏首字母。

KMP算法是String Search算法,之前搜索String,可以用BF,或者BM。

BF

暴力算法,对主串和模式串进行逐个比较。第一轮时,先对第一个字符进行比较,如果不合适就将模式串右移一位,然后继续比较;依次类推,直到合适匹配或者不符合为止。这样比较由于每次都要重头比较,效率太低。

BM

模式串的比较是从右到左,模式串的移动是从左到右,借用坏字符规则和好后缀规则,在每一轮比较时,可以让模式串尽可能的多移动几位。

KMP算法

和BM很相似,也是为了让模式串在每一轮多移动几位。

首先先明白字符串的前缀和后缀。比如一个string,{ababac},前缀集合就是{a,ab,aba,abab,ababa},后缀集合就是{babac,abac,bac,ca,a},那么交集就是{a},就是公共子串。

假设主串{ABABABAC},模式串{ABABAC},那么先找到公共子串{ABA},在主串和模式串中可以分别称为最长可匹配后缀子串和最长可匹配前缀子串

在这里插入图片描述

当C与B不匹配的时候,就根据获得的公共子串的长度,进行移动,找模式串中的长度+1位置的元素,和主串进行比较。比如例子中是3,就右移至和最长可匹配后缀子串相匹配,找第四位与主串相对的位置比较。

在这里插入图片描述

由此可以生成next数组,来缓存记录找到的最长可匹配后缀子串和最长可匹配前缀子串。

在这里插入图片描述

有些地方的index开始位置不一样,这里借鉴b站视频,网上有很多写KPM的文章,读了很多后还是阮一峰大神的比较清楚。

相关文章
|
22天前
|
算法
数据结构中的KMP算法及其改进算法
KMP算法通过引入部分匹配表,有效避免了重复计算,从而将字符串匹配的时间复杂度降低到O(m+n)。通过进一步优化next数组,KMP算法的效率得到了进一步提升。对于大规模字符串匹配问题,KMP算法及其改进算法提供了高效的解决方案,是计算机科学领域的经典算法之一。
23 3
|
2天前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
1天前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
2天前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
4天前
|
人工智能 算法 BI
一篇文章讲明白KMP算法(俗称看毛片算法)
一篇文章讲明白KMP算法(俗称看毛片算法)
|
10天前
|
算法 Java
Java数据结构与算法:字符串匹配算法之KMP算法
Java数据结构与算法:字符串匹配算法之KMP算法
|
2月前
|
算法 搜索推荐 程序员
第六十三练 字符串匹配 - KMP算法
第六十三练 字符串匹配 - KMP算法
26 2
|
2月前
|
算法
|
2月前
|
存储 自然语言处理 算法
【算法】----BF算法&KMP算法
【算法】----BF算法&KMP算法
22 0
|
2月前
|
算法 C语言
KMP算法(C语言实现)
KMP算法(C语言实现)
27 0