带你读《图解算法小抄》二十四、字符串(2)

简介: 带你读《图解算法小抄》二十四、字符串(2)

带你读《图解算法小抄》二十四、字符串(1)https://developer.aliyun.com/article/1347819?groupCode=tech_library


4动态规划方法解释

让我们以查找字符串 ME 和 MY 之间的最小编辑距离为例。直观上,您已经知道这里的最小编辑距离是 1,即将 E 替换为 Y。但是,让我们试图将其正式化为算法形式,以便能够处理更复杂的示例,如将 Saturday 转换为 Sunday。

 

为了将上述数学公式应用于 ME → MY 转换,我们需要事先知道 ME → M、M → MY 和 M → M 转换的最小编辑距离。然后,我们需要选择其中最小的一个,并在最后一个字母 E → Y 上增加一次操作。因此,ME → MY 转换的最小编辑距离是基于三个先前可能的转换计算得出的。

 

为了进一步解释这一点,我们来绘制下面的矩阵:

 

image.png

Levenshtein 矩阵

 

  • 单元格 (0:1) 包含红色数字 1。这意味着我们需要 1 次操作将 M 转换为空字符串。这就是为什么这个数字是红色的。
  • 单元格 (0:2) 包含红色数字 2。这意味着我们需要 2 次操作将 ME 转换为空字符串。这是通过删除 E 和 M 完成的。
  • 单元格 (1:0) 包含绿色数字 1。这意味着我们需要 1 次操作将空字符串转换为 M。这是通过插入 M 完成的。这就是为什么这个数字是绿色的。
  • 单元格 (2:0) 包含绿色数字 2。这意味着我们需要 2 次操作将空字符串转换为 MY。这是通过插入 Y 和 M 完成的。
  • 单元格 (1:1)包含数字 0。这意味着将 M 转换为 M 不需要任何操作。
  • 单元格 (1:2) 包含红色数字 1。这意味着我们需要 1 次操作将 ME 转换为 M。这是通过删除 E 完成的。
  • 以此类推...

对于我们这样小的矩阵(只有 3x3),看起来很简单。但是,您可以从中找到可以应用于计算更大矩阵(例如,用于 Saturday → Sunday 转换的 9x7 矩阵)的基本概念。

根据上述公式,您只需要找到相邻单元格 (i-1:j)、(i-1:j-1) 和 (i:j-1) 中的最小值,然后在行 i 的字母和列 j 的字母不同的情况下加 1。

 

您可以清楚地看到问题的递归性质。

 

image.png

 

让我们为这个问题绘制一个决策图。

 

image.png

 

您可以在图片中看到一些带有红色标记的重叠子问题。而且没有办法减少操作数并使其少于公式中那三个相邻单元格中的最小值。

 

带你读《图解算法小抄》二十四、字符串(3)https://developer.aliyun.com/article/1347817

相关文章
|
4月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
2月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
89 1
两个字符串匹配出最长公共子序列算法
|
4月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
5月前
|
自然语言处理 算法 搜索推荐
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。
283 1
|
5月前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
123 1
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
4月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
84 0
|
5月前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
6月前
|
存储 算法 Java
Java数据结构与算法:用于高效地存储和检索字符串数据集
Java数据结构与算法:用于高效地存储和检索字符串数据集
|
6月前
|
算法 Java
Java数据结构与算法:字符串匹配算法之暴力匹配
Java数据结构与算法:字符串匹配算法之暴力匹配
|
6月前
|
算法 Java
Java数据结构与算法:字符串匹配算法之KMP算法
Java数据结构与算法:字符串匹配算法之KMP算法