九分钟带你弄懂KMP算法【C语言实现篇】

简介: 定义一个函数,传入参数为两个字符串,以及一个pos(表示从主串str的哪个位置开始搜寻子串pat)

写在前面:


          我将KMP算法分为了三个篇章:


        【原理篇】:主要讲解KMP实现的原理,以及手动求NEXT数组


        【数理篇】:主要讲解如何在手动求出NEXT数组的情况下,找出数学规律,为之后的算法实现奠定基础。


     ->【实现篇】:主要讲解以C语言代码的方式实现KMP算法,以及NEXT数组的优化。


         本篇章将结合前两章所讲内容,代入C代码进行实现吗。可点访问我的个人主页进行回顾,也可点击上方对应链接访问,那么我们开始了。


🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈


C代码实现:


初始化与基础情况处理:


int KMP(char *str,char*pat,int pos)
{
    assert(str&&pat);
    const int lenstr=strlen(str);
    const int lenpat=strlen(pat);
    int *next=NULL;
    next=(int*)malloc(sizeof(int)*lenpat);
    if(!lenstr||!lenpat)return -1;
    if(pos<0||pos>=lenstr)return -1;


定义一个函数,传入参数为两个字符串,以及一个pos(表示从主串str的哪个位置开始搜寻子串pat)

若传入参数为空则assert报警。将主串与模板串的长度存入变量,防止以后每次想要获取长度时都调用函数,节省时间。

创建NEXT数组分配长度为LENPAT的空间大小。若主串||模板串大小为0||pos<0||pos>=主串长度,则函数结束。


NEXT数组实现:


PAT[i]=PAT[k]


在PAT[i]=PAT[k]的情况下,NEXT[i+1]=k+1。因为NEXT数组0号位与1号位是规定好的-1与0的值,所以我们初始化时直接将他们填入即可,此时我们的i从2号位开始而我们的k从0号位开始,此时的情况如下方所示。



k
实际的i i(要求的)
0 1 2 3 4 5 6 7 8 9 10
PAT字符串 a b a a b a b c a b c
NEXT数组 -1 0


套用我们的公式,可以很轻松的得出NEXT[2]=1(k+1)。但是,在代码当中这个i所对应的NEXT数组,也就是NEXT[i]是未知的,而我们之前所有的推论都基于NEXT[i]=k,也就是NEXT已知的情况下,所以公式里的i实际上是这里的i-1。所以真正的(代码)公式是NEXT[i+1]=k+1



k
实际的i i+1
0 1 2 3 4 5 6 7 8 9 10
PAT字符串 a b a a b a b c a b c
NEXT数组 -1 0


所以这时的NEXT[i+1]=-1+1=0;


PAT[i]!=PAT[k]


综上这里写的i也是代表我们要求的i,所以我们现在实际要判断的是i-1的位置上PAT[i-1]!=PAT[k],此时k=NEXT[k]进行一个回滚的操作。

NEXT数组代码实现:


void  GetNext(char*pat,int * next,int lenpat)
{
    next[0]=-1;
    next[1]=0;
    int i=2;//当前i下标
    int k=0;//next数组里的数 
    for(;i<lenpat;)
    {
    // p[i]==p[k] next[i+1]=k+1
        if(k==-1||pat[i-1]==pat[k])
        {
            next[i]=k+1;
            i++;
            k++;
        }
        else {
            k=next[k];
        }
    }
}


首先进行初始化。之后进入一个循环,若满足k==-1(边界的设置)||pat[i-1]==pat[k]则说明匹配成功,两个下标加一,进入到下一个匹配,反之k=NEXT[k]进行一个回滚的操作


至此NEXT数组函数完结。

KMP函数:


int KMP(char *str,char*pat,int pos)
{
    assert(str&&pat);
    const int lenstr=strlen(str);
    const int lenpat=strlen(pat);
    int *next=NULL;
    next=(int*)malloc(sizeof(int)*lenpat);
    if(!lenstr||!lenpat)return -1;
    if(pos<0||pos>=lenstr)return -1;
    GetNext(pat,next,lenpat);
    int i=pos;
    int j=0;
    while(i<lenstr&&j<lenpat)
    {
        if(j==-1||str[i]==pat[j]){
            i++;
            j++;
        }
        else {
            j=next[j];
        }
    }
    if(j>=lenpat)return i-j;
    return -1; 
}


求出NEXT数组后,返回到KMP函数当中,进入主串与模板串的匹配。循环条件为两个指针小于各自数组的长度。当j==-1||str[i]==pat[j],表示匹配上了,此时指针前移,其余部分与NEXT数组实现大同小异,这里就不过多赘述。


之后返回i-j表示从主串当中哪里开始匹配上的。否则返回-1.

KMP算法代码部分:


#include<stdio.h>
#include<string.h>
#include<assert.h>
#include<malloc.h>
// str为主串 pat为子串 pos为寻找的起始位置
void  GetNext(char*pat,int * next,int lenpat)
{
    next[0]=-1;
    next[1]=0;
    int i=2;//当前i下标
    int k=0;//next数组里的数 
    for(;i<lenpat;)
    {
    // p[i]==p[k] next[i+1]=k+1
        if(k==-1||pat[i-1]==pat[k])
        {
            next[i]=k+1;
            i++;
            k++;
        }
        else {
            k=next[k];
        }
    }
}
int KMP(char *str,char*pat,int pos)
{
    assert(str&&pat);
    const int lenstr=strlen(str);
    const int lenpat=strlen(pat);
    int *next=NULL;
    next=(int*)malloc(sizeof(int)*lenpat);
    if(!lenstr||!lenpat)return -1;
    if(pos<0||pos>=lenstr)return -1;
    GetNext(pat,next,lenpat);
    int i=pos;
    int j=0;
    while(i<lenstr&&j<lenpat)
    {
        if(j==-1||str[i]==pat[j]){
            i++;
            j++;
        }
        else {
            j=next[j];
        }
    }
    if(j>=lenpat)return i-j;
    return -1; 
}
int main()
{
    printf("%d\n",KMP((char*)"ababcabcdabcde", (char*)"abcd",0));
}
// 有一种植物有一种动物像鸡 请问是什么植物和动物


完结撒花:


留有一个彩蛋看上方最后一行的注释(doge


附上Gitee链接,若想要完整代码可以自取KMP算法实现


至此,本篇博客的内容九分钟带你弄懂KMP算法【实现篇】告一段落,KMP相关的所有内容也已更新完毕,可访问我的主页进行查看,接下来我会更新LeetCode上KMP相关的算法题。


若对你有些许帮助,可以点赞、关注、评论支持下博主,你的支持将是我前进路上最大的动力。


若以上内容有任何问题,欢迎在评论区指出。若对以上内容有任何不解,都可私信评论询问。


诸君,山顶见!


🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈

ppeua
+关注
目录
打赏
0
0
0
0
10
分享
相关文章
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
161 1
【排序算法】快速排序升级版--三路快排详解 + 实现(c语言)
本文介绍了快速排序的升级版——三路快排。传统快速排序在处理大量相同元素时效率较低,而三路快排通过将数组分为三部分(小于、等于、大于基准值)来优化这一问题。文章详细讲解了三路快排的实现步骤,并提供了完整的代码示例。
118 4
C 语言递归算法:以简洁代码驾驭复杂逻辑
C语言递归算法简介:通过简洁的代码实现复杂的逻辑处理,递归函数自我调用解决分层问题,高效而优雅。适用于树形结构遍历、数学计算等领域。
C语言算法复杂度
【10月更文挑战第20天】
63 5
C语言算法复杂度
C语言在实现高效算法方面的特点与优势,包括高效性、灵活性、可移植性和底层访问能力
本文探讨了C语言在实现高效算法方面的特点与优势,包括高效性、灵活性、可移植性和底层访问能力。文章还分析了数据结构的选择与优化、算法设计的优化策略、内存管理和代码优化技巧,并通过实际案例展示了C语言在排序和图遍历算法中的高效实现。
116 2
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
112 1
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
121 1
【排序算法】八大排序(下)(c语言实现)(附源码)
本文继续学习并实现了八大排序算法中的后四种:堆排序、快速排序、归并排序和计数排序。详细介绍了每种排序算法的原理、步骤和代码实现,并通过测试数据展示了它们的性能表现。堆排序利用堆的特性进行排序,快速排序通过递归和多种划分方法实现高效排序,归并排序通过分治法将问题分解后再合并,计数排序则通过统计每个元素的出现次数实现非比较排序。最后,文章还对比了这些排序算法在处理一百万个整形数据时的运行时间,帮助读者了解不同算法的优劣。
239 7
【排序算法】八大排序(上)(c语言实现)(附源码)
本文介绍了四种常见的排序算法:冒泡排序、选择排序、插入排序和希尔排序。通过具体的代码实现和测试数据,详细解释了每种算法的工作原理和性能特点。冒泡排序通过不断交换相邻元素来排序,选择排序通过选择最小元素进行交换,插入排序通过逐步插入元素到已排序部分,而希尔排序则是插入排序的改进版,通过预排序使数据更接近有序,从而提高效率。文章最后总结了这四种算法的空间和时间复杂度,以及它们的稳定性。
208 8
【C语言】二分查找算法
【C语言】二分查找算法

热门文章

最新文章