带你读《图解算法小抄》二十四、字符串(5)

简介: 带你读《图解算法小抄》二十四、字符串(5)

带你读《图解算法小抄》二十四、字符串(4)https://developer.aliyun.com/article/1347815?groupCode=tech_library


5.Z 算法


Z 算法用于在线性时间 O(|W| + |T|) 内查找主字符串 T 中的一个单词 W 的出现位置。

给定长度为 n 的字符串 S,该算法产生一个数组 Z,其中 Z[i] 表示以 S[i] 开头的最长子串,该子串也是 S 的前缀。通过计算在单词 W 后连接一个特殊字符(例如 $)和文本 T 后所得到的字符串的 Z 数组,可以帮助进行模式匹配。如果存在某个索引 i,使得 Z[i] 等于模式的长度,则该模式必定存在于该位置。

 

尽管可以使用两层嵌套循环以 O(|W| * |T|) 的时间计算 Z 数组,但下面的策略展示了如何在线性时间内获得 Z 数组。其基本思想是,当我们迭代字符串中的字母时(索引从 1 到 n-1),我们维护一个区间 [L, R],它是具有最大 R 的区间,使得 1 ≤ L ≤ i ≤ R S[L...R] 是一个同时是前缀和子串的字符串(如果不存在这样的区间,则令 L = R = -1)。对于 i = 1,我们可以通过比较 S[0...] S[1...] 来计算 L R

1Z 数组示例

Index            0   1   2   3   4   5   6   7   8   9  10  11 
Text             a   a   b   c   a   a   b   x   a   a   a   z
Z values         X   1   0   0   3   1   0   0   2   2   1   0

 

其他示例

 

str =  a a a a a a
Z[] =  x 5 4 3 2 1

 

str =  a a b a a c d
Z[] =  x 1 0 2 1 0 0

 

str =  a b a b a b a b
Z[] =  x 0 6 0 4 0 2 0

2复杂度

  • 时间复杂度:O(|W| + |T|)
  • 空间复杂度:O(|W|)

3参考资料

  • GeeksForGeeks
  • YouTube
  • Ivan Yurchenko 的 Z 算法文章

6.Knuth–Morris–Pratt 算法


Knuth–Morris–Pratt 字符串搜索算法(或 KMP 算法)通过利用以下观察结果,在主文本字符串 T 中搜索单词 W 的出现。当出现不匹配时,单词本身提供了足够的信息来确定下一次匹配可以开始的位置,从而避免重新检查先前匹配的字符。

1复杂度

  • 时间复杂度: O(|W| + |T|)(比朴素算法 O(|W| * |T|) 更快)
  • 空间复杂度: O(|W|)

2参考资料

  • 维基百科
  • YouTube

带你读《图解算法小抄》二十四、字符串(6)https://developer.aliyun.com/article/1347812

相关文章
|
3月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
29天前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
60 1
两个字符串匹配出最长公共子序列算法
|
3月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
4月前
|
自然语言处理 算法 搜索推荐
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。
264 1
|
4月前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
110 1
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
3月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
74 0
|
4月前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
5月前
|
存储 算法 Java
Java数据结构与算法:用于高效地存储和检索字符串数据集
Java数据结构与算法:用于高效地存储和检索字符串数据集
|
5月前
|
算法 Java
Java数据结构与算法:字符串匹配算法之暴力匹配
Java数据结构与算法:字符串匹配算法之暴力匹配
|
5月前
|
算法 Java
Java数据结构与算法:字符串匹配算法之KMP算法
Java数据结构与算法:字符串匹配算法之KMP算法