最长公共子串

简介: 最长公共子串

1. 最长公共子串

描述

有两个字符串(可能包含空格),请找出其中最长的公共连续子串,输出其长度。(长度在1000以内)

例如:

输入:abcde bcd

输出:3

解析

1、把两个字符串分别以行和列组成一个二维矩阵。

2、比较二维矩阵中每个点对应行列字符中否相等,相等的话值设置为1,否则设置为0。

3、通过查找出值为1的最长对角线就能找到最长公共子串。

比如:str=acbcbcef,str2=abcbced,则str和str2的最长公共子串为bcbce,最长公共子串长度为5。

针对于上面的两个字符串我们可以得到的二维矩阵如下:

从上图可以看到,str1 和 str2 共有 5 个公共子串,但最长的公共子串长度为 5。

为了进一步优化算法的效率,我们可以再计算某个二维矩阵的值的时候顺便计算出来当前最长的公共子串的长度,即某个二维矩阵元素的值由 record[i][j]=1 演变为 record[i][j]=1 +record[i-1][j-1] ,这样就避免了后续查找对角线长度的操作了。修改后的二维矩阵如下:

递推公式为:

当A[i] != B[j],dp[i][j] = 0

当A[i] == B[j],

若i = 0 || j == 0,dp[i][j] = 1

否则 dp[i][j] = dp[i - 1][j - 1] + 1

代码

仔细看看,一定可以掌握

暴力法

public int getLCS(String s, String s2) {
        if (s == null || t == null) {
            return 0;
        }
        int l1 = s.length();
        int l2 = t.length();
        int res = 0;
        for (int i = 0; i < l1; i++) {
            for (int j = 0; j < l2; j++) {
                int m = i;
                int k = j;
                int len = 0;
                while (m < l1 && k < l2 && s.charAt(m) == t.charAt(k)) {
                    len++;
                    m++;
                    k++;
                }
                res = Math.max(res, len);
            }
        }
        return res;
    }

动态规划

public int getLCS(String s, String t) {
        if (s == null || t == null) {
            return 0;
        }
        int result = 0;
        int sLength = s.length();
        int tLength = t.length();
        int[][] dp = new int[sLength][tLength];
        for (int i = 0; i < sLength; i++) {
            for (int k = 0; k < tLength; k++) {
                if (s.charAt(i) == t.charAt(k)) {
                    if (i == 0 || k == 0) {
                        dp[i][k] = 1;
                    } else {
                        dp[i][k] = dp[i - 1][k - 1] + 1;
                    }
                    result = Math.max(dp[i][k], result);
                } else {
                    dp[i][k] = 0;
                }
            }
        }
        return result;
    }


简化-优化

简化一下递推公式:

当A[i] != B[j],dp[i][j] = 0

否则 dp[i][j] = dp[i - 1][j - 1] + 1

全部都归结为一个公式即可,二维数组默认值为0

public int getLCS(String s, String t) {
        if (s == null || t == null) {
            return 0;
        }
        int result = 0;
        int sLength = s.length();
        int tLength = t.length();
        int[][] dp = new int[sLength + 1][tLength + 1];
        for (int i = 1; i <= sLength; i++) {
            for (int k = 1; k <= tLength; k++) {
                if (s.charAt(i - 1) == t.charAt(k - 1)) {
                    dp[i][k] = dp[i - 1][k - 1] + 1;
                    result = Math.max(dp[i][k], result);
                }
            }
        }
//        for (int i = 1; i <= sLength + 1; i++) {
//            for (int k = 1; k <= tLength + 1; k++) {
//                System.out.print(dp[i - 1][k - 1] + " ");
//            }
//            System.out.println();
//        }
        return result;
    }

行、列都多一行,更适应公式。


目录
相关文章
|
17天前
|
Java
5.最长回文子串
5.最长回文子串
|
9月前
|
算法
next数组(详细求法)
next数组(详细求法)
148 0
Leecode 5. 最长回文子串
Leecode 5. 最长回文子串
31 1
Leecode 345 翻转字符串中的元音字母-双指针法
做算法的步骤: 写思路,标注步骤 先实现大头 考虑细节(越界问题、个例) 题目
|
算法 Java 索引
最长回文子串
最长回文子串
98 0
最长回文子串
|
算法 PHP Python
最长公共子串- LCS 算法
最长公共子串- LCS 算法
80 0
[解题报告](第24讲) 字符串算法(四) - 字符计数法(1)
[解题报告](第24讲) 字符串算法(四) - 字符计数法
[解题报告](第24讲) 字符串算法(四) - 字符计数法(1)
[解题报告](第24讲) 字符串算法(四) - 字符计数法(2)
[解题报告](第24讲) 字符串算法(四) - 字符计数法
[解题报告](第24讲) 字符串算法(四) - 字符计数法(2)
|
算法 网络协议
[解题报告](第23讲) 字符串算法(三) - 字符串分割
[解题报告](第23讲) 字符串算法(三) - 字符串分割
[解题报告](第23讲) 字符串算法(三) - 字符串分割