大话数据结构--串的匹配算法

简介: 大话数据结构--串的匹配算法

前言


废话不多,数据结构必须学! 每天更新一章,一篇写不完的话会分成两篇来写~

资料获取

image.png


朴素的模式匹配算法


在文章(相当于一个大串)中找到单词的定位,这种子串的定位操作通常称做串的模式匹配

这是串中很重要的操作之一


实例


我们要找到主串S=“wyjbat”中,找到T = “bat”这个子串的位置。通常要进行下面的步骤。

1.主串S第一位开始,S与T字母进行匹配

image.png

2.多次比较从4位开始,S与T,3个字母全匹配,匹配成功

image.png


简单的说,就是对主串的每一个字符作为子串开头,与要匹配的字符串进行匹配。对主串做大循环,每个字符开头做T的长度的小循环,直到匹配成功或全部遍历完成为止。

这个算法也太低效了,不玩!!


5.6 KMP模式匹配算法


什么是KMP?


三个科学家D.E.Knuth、 J.H.Morris 和V.R.Pratt,以他们的姓氏命名的


为什么要用KMP算法?


因为暴力匹配效率太低

比如我们要在主串中匹配子串ABCD,这很简单对吧,常规的思路就是一位一位的匹配(这个思路就是暴力匹配算法)

image-20211116093132194

image.png

如果对不上了,我们让子串往后移动

image.png

上面这种思路可以用代码来实现

/**
  * 暴力破解法
  * @param ts 主串
  * @param ps 模式串
  * @return 如果找到,返回在主串中第一个字符出现的下标,否则为-1
  */
 public static int bf(String ts, String ps) {
     char[] t = ts.toCharArray();
     char[] p = ps.toCharArray();
     int i = 0; // 主串的位置
     int j = 0; // 模式串的位置
     while (i < t.length && j < p.length) {
        if (t[i] == p[j]) { // 当两个字符相同,就比较下一个
            i++;
            j++;
        } else {
            i = i - j + 1; // 一旦不匹配,i后退
            j = 0; // j归0
        }
     }
     if (j == p.length) {
        return i - j;
     } else {
        return -1;
     }
 }

上面的程序没问题,只能说不够好!

主串匹配失败的位置除了第一个A之外再也没有A了,我们为什么知道主串前面只有一个A?因为前三个已经匹配过了啊!它们都是匹配的。

我们可以这样保存i不动,移动j

image.png

KMP算法的思想就是利用已经部分匹配的有效信息,保持i指针不回溯,通过修改j指针,让子串尽量的移动到有效的位置!

再详细的可以观看这篇文章,写的很好!

我就不更了,日后在更

(原创)详解KMP算法 - 孤~影 - 博客园 (cnblogs.com)


KMP模式匹配算法实现


/*通过计算返回子串T的next数组。*/
 ?void get_ next ( String T, int *next )
 {
     int i,j;
     i=1;
     j=0;
     next[1]=0;
     while ( i<T[0]) /*此处T[0]表示串T的长度*/
     {
     if (j==0 11 T[i]== T[j]) /* T[i]表示后缀的单个字符,*/
                             /* T[j]表示前缀的单个字符*/
     {
         ++i;
         ++j;
         next[i]=j;
     }
     else
     j= next[j]; /*若字符不相同,则j值回溯*/
     }     
 }


/*返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数返回值为0。*/
 /* T非空,1SposSStrLength (s)。*/
 int Index KMP (String s, String T, int pos )
 {
     int i= pos;/*i用于主串S当前位置下标值,若pos不为1, */
                 /*则从pos位置开始匹配*/
     int j= 1;   /*j用于子串T中当前位置下标值*/
     int next[255] ; /*定义一next数组*/
     get_ next(T, next); /*对串工作分析,得到next数组*/
     while(i<= S[0] &j<= T[0]) /*若i小于S的长度且j小于T的长度时,*/
                             /*循环继续*/
     {
         if (j==0日1 S[i]== T[j]) /*两字母相等则继续,与朴素算法增加了*/
                                 /*j=0判断*/
         ++i;
         ++j;
         else    /*指针后退重新开始匹配★/
     {
         j = next[j];    /* j退回合适的位置,i值不变*/
     }
     if(j > T[0] )
         return i-T[0] ;
     else
         return 0;
 }


5.7总结


串是由零个或多个字符组成的有限序列,又名字符串。本质上是一种线性表的扩展,相对于线性表关注一个个元素来说,串这种结构更多的是关注它子串的应用问题,如查找、替换等操作。现在的高级语言都有针对串的函数可以调用,我们在使用这些函数的时候,同时也应该要理解它当中的原理,以便于再碰到复杂问题时,可以更灵活的使用



相关文章
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
51 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
124 4
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
101 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
13天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
50 20
|
2月前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
112 23
|
2月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
63 20
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
65 1
|
2月前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
59 0