数据结构——KMP算法

简介: 数据结构——KMP算法

831. KMP字符串

给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模式串 P 在字符串 S 中多次作为子串出现。

求出模式串 P 在字符串 S 中所有出现的位置的起始下标。

输入格式

第一行输入整数 N,表示字符串 P 的长度。

第二行输入字符串 P。

第三行输入整数 M,表示字符串 S 的长度。

第四行输入字符串 S。

输出格式

共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。

数据范围

1≤N≤10^5

1≤M≤10^6

输入样例:

3

aba

5

ababa

输出样例:

0 2

暴力解法  时间复杂度平方级别会超时

1. int i,j;
2.  for(i=1;i<=m-n+1;i++){
3.    for(j=1;j<=n;j++){
4.      if(s[i]!=s[j]) break;
5.    }
6.    if(j>m) cout<<i<<" ";
7.  }

KMP算法

1.取最长的相等前后缀,可以保证不漏解。

2.通过模式串前后缀的自我匹配的长度,计算next函数,给指针打一张表,失配时就跳到next[j]的位置继续匹配。

next函数

next[i]表示模式串P[1,i]中相等前后缀的最长长度。

next函数

next[i]表示模式串P[1,i]中相等前后缀的最长长度。

双指针:i扫描模式串,j扫描前缀。

初始化,ne[1]=0,i=2,j=0。

每轮for循环,i向右走一步。

1.若P[i]!=P[j+1],让j回跳到能匹配的位置,如果找不到能匹配的位置,j回跳到0。

2.若P[i]==P[j+1],让j+1,指向匹配前缀的末尾。

3.next[i]等于j的值。

1. int ne[N];//最长相等真前后缀的长度
2. void do_next() {
3.    ne[1]=0;//初始化数据
4. for(int i=2,j=0;i<=n;i++){//i扫描字符串 j扫描前缀
5. while(j && p[i]!=p[j+1]) j=ne[j];//回跳
6. if(p[i]==p[j+1]) j++;//相同 增加一个
7.      ne[i]=j;//记录P[1,i]中相等前后缀的最长长度
8.    }
9.  }

j指针所走的总步数就决定了总的执行次数。

每轮for,j至多+1,那么j一共向右至多走n步,往左跳的步数加起来不会超过n步,否则j变为负数,故j的总步数不会超过2n。例a…ab。所以时间复杂度O(n)。

模式串与主串匹配

双指针:i扫描主串,j扫描模式串。

初始化,i=1,j=0。每轮for,i向右走一步。

1.若S[i]!=P[j+1],让j回跳到能匹配的位置,如果找不到能匹配的位置,j回跳到0。

2.若S[i]==P[j+1],让j向右走一步。

3.若匹配成功,输出匹配位置。

1. void do_KMP(){
2. for(int i=1,j=0;i<=m;i++){
3. while(j &&s[i]!=p[j+1]) j=ne[j]; //不同 j指针回跳
4. if(s[i]==p[j+1]) j++; //相同 j指针右移
5. if(j==n) printf("%d ",i-n+1);//匹配成功 输出位置
6.    }
7.  }

j指针所走的总步数就决定了总的执行次数。

每轮for,j至多+1,那么j一共向右至多走m步,往左跳的步数加起来不会超过m步,否则j变为负数,故j最多走2m步。例a……a,ab。所以时间复杂度0(m)

1. //完整参考代码
2. #include <iostream>
3. #include <cstdio>
4. #include <cstring>
5. using namespace std;
6. const int N=1e6+5;
7. int m,n;
8. char s[N],p[N];
9. int ne[N];//最长相等的真前后缀的长度
10. void do_next(){
11.   ne[1]=0;
12.   for(int i=2,j=0;i<=n;i++){
13.     while(j&&p[i]!=p[j+1])j=ne[j];
14.     if(p[i]==p[j+1]) j++;
15.     ne[i]=j;
16.   }
17. }
18. void do_KMP(){
19.   for(int i=1,j=0;i<=m;i++){
20.     while(j &&s[i]!=p[j+1]) j=ne[j];
21.     if(s[i]==p[j+1]) j++;
22.     if(j==n) printf("%d ",i-n);//注意题目当中的下标起点是0还是1
23.   }
24. }
25. int main()
26. {
27.   cin>>n;
28.   cin>>p+1;
29.   cin>>m;
30.   cin>>s+1;
31.   do_next();
32.   do_KMP();
33. return 0;
34. }
相关文章
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
58 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
146 4
|
17天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
50 20
|
2月前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
119 23
|
2月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
64 20
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
70 1
|
2月前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
62 0
|
2月前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
69 0
下一篇
开通oss服务