字符串-KMP算法

简介: 字符串-KMP算法

描述

字符串匹配的问题可以大致描述为:给定主串S(Source,长度为n),模式串P(Pattern,长度为m),要求查找出P在S中出现的位置。最常见的做法的是暴力查找,linux的string.h中使用的就是:

char * strstr(register const char *s, register constchar *wanted)
{
     register const size_t len = strlen(wanted);
     if (len ==0) return (char*)s;
     while (*s !=* wanted || strncmp(s, wanted, len))
         if (*s++=='\0')
             return (char*)NULL;
     return (char*)s;
}

该算法的复杂度是S_len * P_len。而KMP算法就是一种更好的算法,利用每次匹配的结果,尽量避免重复进行不可能位置的匹配,快速的向右移动查找结果。

KMP算法

KMP算法的主要思想是保持主串S向右移动不变,不断的回溯模式串P

主串S在位置D匹配失败,如果此时回溯模式串P的话,那么究竟移动多少其实需要看模式串的特征,即已匹配有效的部分是[ABCDAB]D括号中的部分,由于D位置不匹配,匹配串右移,[ABCDAB]移动成[AB]CDAB才能停下来。由于前面是已经匹配的部分,而移动的又是模式串,移动的模式串的过程其实是模式串前缀和模式串后缀匹配的过程,即:

  • 模式串移动位数 = 已匹配的模式串位数 - 模式串中前缀和后缀最大公共长度

前缀和后缀最大公共长度

该部分的思想较为简单,其实是根据P[0…i]求P[i+1]的长度的问题,详细算法见下图。

![KMP](/public/blog-img/algorithm/kmp.png)

本文作者 : cyningsun

本文地址https://www.cyningsun.com/04-04-2016/kmp.html

版权声明 :本博客所有文章除特别声明外,均采用 CC BY-NC-ND 3.0 CN 许可协议。转载请注明出处!

目录
相关文章
|
1月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
1月前
|
算法 C++
A : DS串应用–KMP算法
这篇文章提供了KMP算法的C++实现,包括计算模式串的next数组和在主串中查找模式串位置的函数,用于演示KMP算法的基本应用。
|
1月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
2月前
|
自然语言处理 算法 搜索推荐
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。
240 1
|
1月前
|
算法
KMP算法
KMP算法
16 0
|
2月前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
1月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
52 0
|
2月前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
23天前
|
算法 BI Serverless
基于鱼群算法的散热片形状优化matlab仿真
本研究利用浴盆曲线模拟空隙外形,并通过鱼群算法(FSA)优化浴盆曲线参数,以获得最佳孔隙度值及对应的R值。FSA通过模拟鱼群的聚群、避障和觅食行为,实现高效全局搜索。具体步骤包括初始化鱼群、计算适应度值、更新位置及判断终止条件。最终确定散热片的最佳形状参数。仿真结果显示该方法能显著提高优化效率。相关代码使用MATLAB 2022a实现。
|
23天前
|
算法 数据可视化
基于SSA奇异谱分析算法的时间序列趋势线提取matlab仿真
奇异谱分析(SSA)是一种基于奇异值分解(SVD)和轨迹矩阵的非线性、非参数时间序列分析方法,适用于提取趋势、周期性和噪声成分。本项目使用MATLAB 2022a版本实现从强干扰序列中提取趋势线,并通过可视化展示了原时间序列与提取的趋势分量。代码实现了滑动窗口下的奇异值分解和分组重构,适用于非线性和非平稳时间序列分析。此方法在气候变化、金融市场和生物医学信号处理等领域有广泛应用。