最长公共子串- LCS 算法

简介: 最长公共子串- LCS 算法

LCS (Longest Common Subsequence) 算法

已知字符串str1="网站高并发解决方案",str2="如何解决网站高并发",如何字符串最长公共子串?

lcs 算法原理

将2个字符串采用行列 排列:

如果行列里面的字符相同,则表示1,否则为0:

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

同时我们可以优化:

很明显,通过坐标可看到,相同的坐标已经标位1,通过计算连续对角线长度,即可比对出最长字符串.

如果行列里面的字符不相同,则表示为0,否则表示为 该坐标左上角的值后再加1:

0

0

0

0

1

0

0

0

0

0

0

0

0

0

2

0

0

0

0

0

0

0

0

0

3

0

0

0

0

0

0

0

0

0

4

0

0

0

0

0

0

0

0

0

5

0

0

1

0

0

0

0

0

0

0

0

0

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

在判断字符串时,记录当前最大值与当前最大值坐标,判断完毕之后,即可通过记录的最大坐标获取到最长字符串最后的坐标值

python实现算法:

#!/usr/bin/python
# coding:utf-8
def action (str1,str2):
    pass
    #转为utf-8编码,一个中文字长度占用1
    str1 = str1.decode("utf-8")
    str2 = str2.decode("utf-8")
    data = {}
    maxNum = 0
    maxLocation = \[\]
    #根据长度遍历2个字符串
    for i in range(len(str1)):
        for j in range(len(str2)):
            v1 = str1\[i\]
            v2 = str2\[j\]
            #如果v1等于v2,则该坐标值+1
            if v1==v2 :
                if data.has_key(i)==False:
                    data\[i\] = {}
                data\[i\]\[j\] = 1;
                # 判断上一个斜线是否已经是相等了,如果是,则增加上上次的值
                if (data.has\_key(i-1)) and (data\[i-1\].has\_key(j-1)) :
                    data\[i\]\[j\] += data\[i-1\]\[j-1\]
                # 修改最大坐标跟最大数值
                if data\[i\]\[j\]>maxNum:
                    maxNum = data\[i\]\[j\]
                    maxLocation = \[i,j\]
    str = ""
    i = maxLocation\[0\]
    j = maxLocation\[1\]
    while True :
        if i<0 or j<0:
            break
        if (data.has\_key(i)==False) or (data\[i\].has\_key(j)==False) :
            break
        str = str1\[i\]+str
        print i,j
        i-=1
        j-=1
    print str,data
result = action("123231aaa测试","12aa测试")

php实现

<?php
function test($str1, $str2)
{
    //创建一个数组
    $data = \[\];
    $str1Arr = mb\_str\_split($str1);//中文切割数组
    $str2Arr = mb\_str\_split($str2);//中文切割数组
    $maxNum = 0;//最大字符串长度
    $maxLocation = \[\];//最大字符串长度坐标
    foreach ($str1Arr as $k1 => $v1) {
        foreach ($str2Arr as $k2 => $v2) {
            //如果值相同
            if ($v1 == $v2) {
                //判断之前的字符串是否存在
                if (isset($data\[$k1 - 1\]\[$k2 - 1\])) {
                    $data\[$k1\]\[$k2\] = 1 + $data\[$k1 - 1\]\[$k2 - 1\];
                } else {
                    $data\[$k1\]\[$k2\] = 1;
                }
                if ($maxNum < $data\[$k1\]\[$k2\]) {
                    $maxNum = $data\[$k1\]\[$k2\];
                    $maxLocation = \[$k1, $k2\];
                }
            } else {
                $data\[$k1\]\[$k2\] = 0;
            }
        }
    }
    if (empty($maxLocation)) {
        $str = '';
    } else {
        $str = '';
        $i = $maxLocation\[0\];
        $j = $maxLocation\[1\];
        while (1) {
            if (empty($data\[$i\]\[$j\])) {
                break;
            }
            $str = $str1Arr\[$i\] . $str;//因为获取到的字符串是最后一位,所以要反向拼接
            $i--;
            $j--;
        }
    }
    return $str;
}
function mb\_str\_split($str){
    return preg_split('/(?<!^)(?!$)/u', $str );
}
$a = test('123456789', '98712345324');
echo $a;
目录
相关文章
【每日算法打卡】LCS 02. 完成一半题目
【每日打卡系列】LeetCode 简单题 200 道
【每日算法打卡】LCS 02. 完成一半题目
|
JavaScript 算法 前端开发
LCS 算法:Javascript 最长公共子序列
LCS 算法:Javascript 最长公共子序列
2745 0
|
人工智能 算法 BI
2017年中国大学生程序设计竞赛-中南地区赛暨第八届湘潭市大学生计算机程序设计大赛题解&源码(A.高斯消元,D,模拟,E,前缀和,F,LCS,H,Prim算法,I,胡搞,J,树状数组)
A------------------------------------------------------------------------------------ 题目链接:http://202.197.224.59/OnlineJudge2/index.php/problem/read/id/1260 题解:随机 n 个数把矩阵补全成 n × n 的。
1283 0
|
14天前
|
机器学习/深度学习 算法
基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真
本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。
146 80
|
2天前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a实现时间序列预测,采用CNN-GRU-SAM网络结构。卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征。完整代码含中文注释和操作视频,运行效果无水印展示。算法通过数据归一化、种群初始化、适应度计算、个体更新等步骤优化网络参数,最终输出预测结果。适用于金融市场、气象预报等领域。
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
|
2天前
|
算法
基于龙格库塔算法的锅炉单相受热管建模与matlab数值仿真
本设计基于龙格库塔算法对锅炉单相受热管进行建模与MATLAB数值仿真,简化为喷水减温器和末级过热器组合,考虑均匀传热及静态烟气处理。使用MATLAB2022A版本运行,展示自编与内置四阶龙格库塔法的精度对比及误差分析。模型涉及热传递和流体动力学原理,适用于优化锅炉效率。
|
1天前
|
算法 数据安全/隐私保护
室内障碍物射线追踪算法matlab模拟仿真
### 简介 本项目展示了室内障碍物射线追踪算法在无线通信中的应用。通过Matlab 2022a实现,包含完整程序运行效果(无水印),支持增加发射点和室内墙壁设置。核心代码配有详细中文注释及操作视频。该算法基于几何光学原理,模拟信号在复杂室内环境中的传播路径与强度,涵盖场景建模、射线发射、传播及接收点场强计算等步骤,为无线网络规划提供重要依据。
|
7天前
|
机器学习/深度学习 算法
基于遗传优化的双BP神经网络金融序列预测算法matlab仿真
本项目基于遗传优化的双BP神经网络实现金融序列预测,使用MATLAB2022A进行仿真。算法通过两个初始学习率不同的BP神经网络(e1, e2)协同工作,结合遗传算法优化,提高预测精度。实验展示了三个算法的误差对比结果,验证了该方法的有效性。

热门文章

最新文章