字符串的模式匹配算法

简介: 一、串的比较比较的是组成串的字符之间的编码(Unicode、ASCII)二、串的抽象数据类型串的逻辑结构和线性表相似,不同之处在于串针对的是字符集对于基本操作,和线性表有区别:线性表关注单个元素的操作,比如查找一个元素,插入删除操作串更多的是查找子串的位置,得到指定位置的子串,替换子串...

一、串的比较

比较的是组成串的字符之间的编码(Unicode、ASCII)

二、串的抽象数据类型

串的逻辑结构和线性表相似,不同之处在于串针对的是字符集
对于基本操作,和线性表有区别:

  1. 线性表关注单个元素的操作,比如查找一个元素,插入删除操作
  2. 串更多的是查找子串的位置,得到指定位置的子串,替换子串

三、串的存储结构

和线性表一样,分为两种:顺序(用一组连续的地址空间)、链式存储结构(一个结点存放多个字符的链表)

四、模式匹配:子串的定位操作,通常称为串的模式匹配

  1. 朴素的模式匹配:(不用其他操作,只用数组实现模式匹配)
public class Demo01{
    public static void main(String []args){
        String s = "happaaaadwdawdfadfasdfadfgadggasdgadhfjkahsdfjgasjdgfjgjhwguyfguagsyudvfvgvaghdsvfghasvdfyeyfyvayevfyuasyudgfjwebjhfvehgvhgfvawefawefeawppy" ;
        String t = "ppy" ;
        
        long start = System.nanoTime() ;
        
        System.out.println(pusuIndex(s,t));
        
        long end = System.nanoTime();
        System.out.println("代码执行时间:"+(end - start)+"ns");
    }
    public static int IndexOf(String str,String t){
        int m = str.length() ;
        int n = t.length() ;
        if(m-n<0)return -1 ;
        
        for(int i=0;i<m-n+1;i++){
            if(str.charAt(i)==t.charAt(0)){
                String temp = str.substring(i,i+n);
                if(temp.equals(t)){
                    return i+1 ;    
                }
            }
        }
        
        return 0 ;
    }
    
    public static int pusuIndex(String s,String t){
        int m = s.length() ;
        int n = t.length() ;
        if(m<n)return -1 ;
        int i = 0 ,j = 0 ;
        while(i<m&&j<n){
            if(s.charAt(i)==t.charAt(j)){
                ++ i ;
                ++ j ;    //j始终是从 0 开始
            }else{
                i = i-j+1 ;
                j = 0 ;    //j又指向t的首位
            }
        }
        if(j==n)return i - n + 1 ;
        else  return 0 ;
    }
}
相关文章
|
3月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
1月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
76 1
两个字符串匹配出最长公共子序列算法
|
1月前
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。
|
3月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
4月前
|
自然语言处理 算法 搜索推荐
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。
273 1
|
4月前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
118 1
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
3月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
81 0
|
4月前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
25天前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
10天前
|
算法 数据挖掘 数据安全/隐私保护
基于FCM模糊聚类算法的图像分割matlab仿真
本项目展示了基于模糊C均值(FCM)算法的图像分割技术。算法运行效果良好,无水印。使用MATLAB 2022a开发,提供完整代码及中文注释,附带操作步骤视频。FCM算法通过隶属度矩阵和聚类中心矩阵实现图像分割,适用于灰度和彩色图像,广泛应用于医学影像、遥感图像等领域。