字符串中的KMP算法及其改进

简介: 字符串中的KMP算法及其改进

公众号merlinsea


  • 字符串的定义
  • 字符串是由0个或者多个字符组成的有限序列,其中字符串中字符的个数称之为串的长度,含有0个字符的串也称之为空串。
  • 字符串的基本操作
  • 赋值操作
  • 取串的长度操作
  • 串的比较操作
  • 求子串操作
  • 清空串的操作
  • 字符串的模式匹配问题
  • 假设有一个主串s 和 一个待匹配的子串p,请问在主串p中能否找到子串s。
  • 解题思路1:双重for循环遍历,然后判断子串p是否出现在子串s中。


public class Main {
    public static void main(String[] args) {
        String s = "abcdsaegsdkjflakji"; // 原串
        String p = "gsdk1"; // 模式串
        boolean res = false;
        for(int i=0;i<=s.length()-p.length();i++){
            int j = 0;
            while(j<p.length()){
                if(p.charAt(j)==s.charAt(i+j)){
                    j++;
                }else{
                    break;
                }
            }
            if(j==p.length()){
                res = true;
                break;
            }
        }
        if(res){
            System.out.println(s + " 包含了 " +p);
        }else{
            System.out.println(s + " 不包含 " +p);
        }
    }
}


  • 算法复杂度分析
  • 时间复杂度O(p.length * s.length)
  • 恐空间复杂度O(1)


  • KMP算法
  • 解法一的字符串匹配问题的时间复杂度是O(p.length * s.length),可以发现这个时间复杂度还是比较高的,那么有没有什么方法可以优化字符串匹配问题呢,下面我们介绍一下字符串的模式匹配算法KMP。

640.png

  • KMP算法介绍
  • 模式匹配算法假设当前不匹配的元素发生在子串p的第i个位置,即子串的[0,i-1]位置是和主串匹配的。
  • 然后我们计算出子串新的下标 i 的位置。
  • 接着我们通过next的数组来决定应该如何移动模式串p。


640.png


  • KMP算法的实现


public class Main {
    public static void main(String[] args) {
        String p = "ABABABB";
        String s = "ABAAABABABBAABBA";
        int[] next = kmp(p);
        System.out.printf("next数组=");
        for(int k : next){
            System.out.printf("%d \t",k);
        }
        System.out.println();
        int i = 0;
        int j = 0;
        while(j<p.length() && i<s.length()){
            if(p.charAt(j) == s.charAt(i)){
                i++;
                j++;
            }else{
                j = next[j]-1;
                if(j<0){
                    j = 0;
                    i++;
                }
            }
        }
        //判断匹配是否成功
        boolean res = j==p.length();
        System.out.println("主串s = "+s);
        System.out.println("子串p = "+p);
        if(res){
            System.out.println("匹配成功");
        }else{
            System.out.println("匹配失败");
        }
    }
    /**
     * next数组是第几个元素,因此n从1开始
     */
    public static int[] kmp(String p){
        int[] next = new int[p.length()];
        next[0]=0;
        /**
         * 当前不匹配元素发生在i位置
         */
        for(int i=1;i<p.length();i++){
            /**
             * 子串向右移动的距离为step
             */
           int step = 1;
           while(step<=i){
               /**
                * 子串的新下标
                */
               int idxSon = 0;
               /**
                * 主串的新下标
                */
               int idxPar = step;
               while(idxPar<i){
                   if(p.charAt(idxPar) == p.charAt(idxSon)){
                       idxPar++;
                       idxSon++;
                   }else{
                       break;
                   }
               }
               /**
                * 说明之前匹配成功了
                */
               if(idxPar == i){
                   next[i] = i-step+1;
                   break;
               }
               step++;
           }
        }
        return next;
    }
}


  • KMP算法的改进
  • 模式匹配算法假设当前不匹配的元素发生在子串p的第i个位置,从这个地方我们还可以推导出主串p对应子串s的位置不是什么元素。


640.png


目录
打赏
0
0
0
0
297
分享
相关文章
局域网行为监控软件 C# 多线程数据包捕获算法:基于 KMP 模式匹配的内容分析优化方案探索
本文探讨了一种结合KMP算法的多线程数据包捕获与分析方案,用于局域网行为监控。通过C#实现,该系统可高效检测敏感内容、管理URL访问、分析协议及审计日志。实验表明,相较于传统算法,KMP在处理大规模网络流量时效率显著提升。未来可在算法优化、多模式匹配及机器学习等领域进一步研究。
43 0
|
9月前
|
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
191 1
两个字符串匹配出最长公共子序列算法
|
9月前
|
第四章 KMP算法理论基础
第四章 KMP算法理论基础
105 0
|
9月前
|
KMP算法
KMP算法
83 0
A : DS串应用–KMP算法
这篇文章提供了KMP算法的C++实现,包括计算模式串的next数组和在主串中查找模式串位置的函数,用于演示KMP算法的基本应用。
|
11月前
|
KMP算法
KMP算法
78 0
基于WOA鲸鱼优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM
本项目基于MATLAB 2022a/2024b实现,采用WOA优化的BiLSTM算法进行序列预测。核心代码包含完整中文注释与操作视频,展示从参数优化到模型训练、预测的全流程。BiLSTM通过前向与后向LSTM结合,有效捕捉序列前后文信息,解决传统RNN梯度消失问题。WOA优化超参数(如学习率、隐藏层神经元数),提升模型性能,避免局部最优解。附有运行效果图预览,最终输出预测值与实际值对比,RMSE评估精度。适合研究时序数据分析与深度学习优化的开发者参考。
基于PSO粒子群优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM
本项目基于MATLAB2022a/2024b开发,结合粒子群优化(PSO)算法与双向长短期记忆网络(BiLSTM),用于优化序列预测任务中的模型参数。核心代码包含详细中文注释及操作视频,涵盖遗传算法优化过程、BiLSTM网络构建、训练及预测分析。通过PSO优化BiLSTM的超参数(如学习率、隐藏层神经元数等),显著提升模型捕捉长期依赖关系和上下文信息的能力,适用于气象、交通流量等场景。附有运行效果图预览,展示适应度值、RMSE变化及预测结果对比,验证方法有效性。
基于遗传算法的256QAM星座图的最优概率整形matlab仿真,对比优化前后整形星座图和误码率
本内容展示了基于GA(遗传算法)优化的256QAM概率星座整形(PCS)技术的研究与实现。通过Matlab仿真,分析了优化前后星座图和误码率(BER)的变化。256QAM采用非均匀概率分布(Maxwell-Boltzman分布)降低外圈星座点出现频率,减小平均功率并增加最小欧氏距离,从而提升传输性能。GA算法以BER为适应度函数,搜索最优整形参数v,显著降低误码率。核心程序实现了GA优化过程,包括种群初始化、选择、交叉、变异等步骤,并绘制了优化曲线。此研究有助于提高频谱效率和传输灵活性,适用于不同信道环境。
45 10

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问