华为机试HJ52:计算字符串的距离(动态规划)

简介: 华为机试HJ52:计算字符串的距离(动态规划)

题目描述:

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。


Ex:


字符串A:abcdefg


字符串B: abcdef


通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。


要求:


给定任意两个字符串,写出一个算法计算它们的编辑距离。

本题含有多组输入数据。

输入描述:

每组用例一共2行,为输入的两个字符串

输出描述:

每组用例输出一行,代表字符串的距离

示例:


输入:

abcdefg

abcdef

abcde

abcdf

abcde

bcdef


输出:

1

1

2

解题思路:

这道题用动态规划法做,建立二分图,解题函数为Levenshtein,辅助函数为getmin,getmin用来计算三个数值的最小值。


首先获取两个字符串a和b,给其开头创建空格,建立二分图,图的上边数据为0123456,意义是将b字符串操作(删除或添加)n次字符,使其和a字符串一致;左边数据同理。


接下来从(1,1)位置开始动态计算,若a[i]==b[j],表示该位置的最小变换次数同a[i-1][j-1]一致;若a[i]!=b[j],则考虑如下三种情况:


  1. a字符串中删除某字符或者b字符串中插入某字符,即L[i][j] = L[i-1][j] + 1;
  2. a字符串中插入某字符或者b字符串中删除某字符,即L[i][j] = L[i][j-1] + 1;
  3. a[i]替换成b[j]或者b[j]替换成a[i],lev[i][j] = lev[i-1][j-1] + 1。

结合如上四种情况动态计算出二分图中每个位置的数据,L[n-1][m-1]的值就是a和b两个字符串的Levenshtein距离。

测试代码:

#include <iostream>
#include <string>
using namespace std;
int getmin(int a,int b,int c)
{
    a=min(a,b);
    b=min(b,c);
    return min(a,b);
}
int Levenshtein(string a,string b)
{
    a.insert(0, 1,' ');
    b.insert(0, 1,' ');
    int n=a.size();
    int m=b.size();
    int k,L[n][m];
    // 相当于删除字符串a的i个字符,使字符串一致
    for(int i=0;i<n;++i)
    {
        L[i][0]=i;
    }
    // 相当于删除字符串b的i个字符,使字符串一致
    for(int i=0;i<m;++i)
    {
        L[0][i]=i;
    }
    // 动态规划建二分表,动态记录最小距离
    for(int i=1;i<n;++i)
    {
        for(int j=1;j<m;++j)
        {
            // 若a和b当前字符一致,则最小距离同i-1和j-1的一致,所以k为0
            if(a[i]==b[j])
                k=0;
            else
                k=1;
            // 若a和b当前字符不一致,有三种可能,取最小数值为当前位置数据
            L[i][j]=getmin(L[i][j-1]+1, L[i-1][j]+1, L[i-1][j-1]+k);
        }
    }
    return L[n-1][m-1];
}
int main()
{
    string a,b;
    while(cin>>a>>b)
    {
        cout<<Levenshtein(a, b)<<endl;
    }
    return 0;
}
相关文章
|
6月前
【每日一题Day302】LC849到最近的人的最大距离 | 贪心+分类讨论
【每日一题Day302】LC849到最近的人的最大距离 | 贪心+分类讨论
54 0
|
6月前
【每日一题Day297】LC1444切披萨的方案数 | 动态规划+二维前缀和
【每日一题Day297】LC1444切披萨的方案数 | 动态规划+二维前缀和
65 0
|
1月前
acwing 173 矩阵距离
acwing 173 矩阵距离
11 0
|
6月前
【每日一题Day350】LC2652倍数求和 | 数学+容斥原理
【每日一题Day350】LC2652倍数求和 | 数学+容斥原理
45 0
|
6月前
【每日一题Day165】LC1039多边形三角剖分的最低得分 | 区间dp
【每日一题Day165】LC1039多边形三角剖分的最低得分 | 区间dp
57 0
|
容器
华为机试HJ60:查找组成一个偶数最接近的两个素数
华为机试HJ60:查找组成一个偶数最接近的两个素数
华为机试HJ91:走方格的方案数
华为机试HJ91:走方格的方案数
128 0
华为机试HJ2:计算某字母出现次数
华为机试HJ2:计算某字母出现次数
华为机试HJ56:完全数计算
华为机试HJ56:完全数计算