最长公共子串- LCS 算法

简介: 最长公共子串- LCS 算法

LCS (Longest Common Subsequence) 算法

已知字符串str1="网站高并发解决方案",str2="如何解决网站高并发",如何字符串最长公共子串?

lcs 算法原理

将2个字符串采用行列 排列:

如果行列里面的字符相同,则表示1,否则为0:

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

1

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

同时我们可以优化:

很明显,通过坐标可看到,相同的坐标已经标位1,通过计算连续对角线长度,即可比对出最长字符串.

如果行列里面的字符不相同,则表示为0,否则表示为 该坐标左上角的值后再加1:

0

0

0

0

1

0

0

0

0

0

0

0

0

0

2

0

0

0

0

0

0

0

0

0

3

0

0

0

0

0

0

0

0

0

4

0

0

0

0

0

0

0

0

0

5

0

0

1

0

0

0

0

0

0

0

0

0

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

在判断字符串时,记录当前最大值与当前最大值坐标,判断完毕之后,即可通过记录的最大坐标获取到最长字符串最后的坐标值

python实现算法:

#!/usr/bin/python
# coding:utf-8
def action (str1,str2):
    pass
    #转为utf-8编码,一个中文字长度占用1
    str1 = str1.decode("utf-8")
    str2 = str2.decode("utf-8")
    data = {}
    maxNum = 0
    maxLocation = \[\]
    #根据长度遍历2个字符串
    for i in range(len(str1)):
        for j in range(len(str2)):
            v1 = str1\[i\]
            v2 = str2\[j\]
            #如果v1等于v2,则该坐标值+1
            if v1==v2 :
                if data.has_key(i)==False:
                    data\[i\] = {}
                data\[i\]\[j\] = 1;
                # 判断上一个斜线是否已经是相等了,如果是,则增加上上次的值
                if (data.has\_key(i-1)) and (data\[i-1\].has\_key(j-1)) :
                    data\[i\]\[j\] += data\[i-1\]\[j-1\]
                # 修改最大坐标跟最大数值
                if data\[i\]\[j\]>maxNum:
                    maxNum = data\[i\]\[j\]
                    maxLocation = \[i,j\]
    str = ""
    i = maxLocation\[0\]
    j = maxLocation\[1\]
    while True :
        if i<0 or j<0:
            break
        if (data.has\_key(i)==False) or (data\[i\].has\_key(j)==False) :
            break
        str = str1\[i\]+str
        print i,j
        i-=1
        j-=1
    print str,data
result = action("123231aaa测试","12aa测试")

php实现

<?php
function test($str1, $str2)
{
    //创建一个数组
    $data = \[\];
    $str1Arr = mb\_str\_split($str1);//中文切割数组
    $str2Arr = mb\_str\_split($str2);//中文切割数组
    $maxNum = 0;//最大字符串长度
    $maxLocation = \[\];//最大字符串长度坐标
    foreach ($str1Arr as $k1 => $v1) {
        foreach ($str2Arr as $k2 => $v2) {
            //如果值相同
            if ($v1 == $v2) {
                //判断之前的字符串是否存在
                if (isset($data\[$k1 - 1\]\[$k2 - 1\])) {
                    $data\[$k1\]\[$k2\] = 1 + $data\[$k1 - 1\]\[$k2 - 1\];
                } else {
                    $data\[$k1\]\[$k2\] = 1;
                }
                if ($maxNum < $data\[$k1\]\[$k2\]) {
                    $maxNum = $data\[$k1\]\[$k2\];
                    $maxLocation = \[$k1, $k2\];
                }
            } else {
                $data\[$k1\]\[$k2\] = 0;
            }
        }
    }
    if (empty($maxLocation)) {
        $str = '';
    } else {
        $str = '';
        $i = $maxLocation\[0\];
        $j = $maxLocation\[1\];
        while (1) {
            if (empty($data\[$i\]\[$j\])) {
                break;
            }
            $str = $str1Arr\[$i\] . $str;//因为获取到的字符串是最后一位,所以要反向拼接
            $i--;
            $j--;
        }
    }
    return $str;
}
function mb\_str\_split($str){
    return preg_split('/(?<!^)(?!$)/u', $str );
}
$a = test('123456789', '98712345324');
echo $a;
目录
相关文章
【每日算法打卡】LCS 02. 完成一半题目
【每日打卡系列】LeetCode 简单题 200 道
【每日算法打卡】LCS 02. 完成一半题目
|
JavaScript 算法 前端开发
LCS 算法:Javascript 最长公共子序列
LCS 算法:Javascript 最长公共子序列
2676 0
|
人工智能 算法 BI
2017年中国大学生程序设计竞赛-中南地区赛暨第八届湘潭市大学生计算机程序设计大赛题解&源码(A.高斯消元,D,模拟,E,前缀和,F,LCS,H,Prim算法,I,胡搞,J,树状数组)
A------------------------------------------------------------------------------------ 题目链接:http://202.197.224.59/OnlineJudge2/index.php/problem/read/id/1260 题解:随机 n 个数把矩阵补全成 n × n 的。
1227 0
|
2天前
|
算法
基于GA遗传优化的混合发电系统优化配置算法matlab仿真
**摘要:** 该研究利用遗传算法(GA)对混合发电系统进行优化配置,旨在最小化风能、太阳能及电池储能的成本并提升系统性能。MATLAB 2022a用于实现这一算法。仿真结果展示了一系列图表,包括总成本随代数变化、最佳适应度随代数变化,以及不同数据的分布情况,如负荷、风速、太阳辐射、弃电、缺电和电池状态等。此外,代码示例展示了如何运用GA求解,并绘制了发电单元的功率输出和年变化。该系统原理基于GA的自然选择和遗传原理,通过染色体编码、初始种群生成、适应度函数、选择、交叉和变异操作来寻找最优容量配置,以平衡成本、效率和可靠性。
|
3天前
|
机器学习/深度学习 算法
基于鲸鱼优化的knn分类特征选择算法matlab仿真
**基于WOA的KNN特征选择算法摘要** 该研究提出了一种融合鲸鱼优化算法(WOA)与K近邻(KNN)分类器的特征选择方法,旨在提升KNN的分类精度。在MATLAB2022a中实现,WOA负责优化特征子集,通过模拟鲸鱼捕食行为的螺旋式和包围策略搜索最佳特征。KNN则用于评估特征子集的性能。算法流程包括WOA参数初始化、特征二进制编码、适应度函数定义(以分类准确率为基准)、WOA迭代搜索及最优解输出。该方法有效地结合了启发式搜索与机器学习,优化特征选择,提高分类性能。
|
3天前
|
机器学习/深度学习 算法 数据可视化
基于BP神经网络的64QAM解调算法matlab性能仿真
**算法预览图省略** MATLAB 2022A版中,运用BP神经网络进行64QAM解调。64QAM通过6比特映射至64复数符号,提高数据速率。BP网络作为非线性解调器,学习失真信号到比特的映射,对抗信道噪声和多径效应。网络在处理非线性失真和复杂情况时展现高适应性和鲁棒性。核心代码部分未显示。
|
1天前
|
算法 计算机视觉
基于Chan-Vese算法的图像边缘提取matlab仿真
**算法预览展示了4幅图像,从边缘检测到最终分割,体现了在matlab2022a中应用的Chan-Vese水平集迭代过程。核心代码段用于更新水平集并显示迭代效果,最后生成分割结果及误差曲线。Chan-Vese模型(2001)是图像分割的经典方法,通过最小化能量函数自动检测平滑区域和清晰边界的图像分割,适用于复杂环境,广泛应用于医学影像和机器视觉。**