今天是2012年12月22日。今天的算法练习题是最长公共子序列的长度求解。
此题初看时,感觉问题非常复杂,要求解两个序列的最长的(可以不连续)的公共子序列。但是,"将复杂的问题分解成简单的问题"是基本的程序设计思想。分治法是将一个大问题分解成多个相似的小问题,而本题采用的动态规划算法,则是将复杂的问题分解成一系列的相似的子问题。另外,将所求解的子问题的解通过数组等容器保存起来,来节省重复求解相同子问题的时间,是动态规划算法的一个很重要的思想:备忘录思想。
另外,本题还将采用逆向的思路,这与常规的顺序的思路相悖。str1[a],str2[b]两个字符串,不是从左至右的考虑,而是从右至左的方向。
分析过程如下:
str1[a],str1[b]是待求最长公共子序列的两个字符串,假设result[c]就是其最长公共子序列。
那么就有以下3种情况。
1.如果str1[a-1]==str2[b-1],那么肯定有result[c-1]=str1[a-1]=str2[b-1],即最后一个元素一定是最长公共子序列的一部分。那么,就可以不再考虑str1[a-1],str2[b-1],result[c-1],从他们之前的元素开始讨论,也就是意味着,result[c-2]及之前的元素就是str1[a-2]之前的元素与str[b-2]之前的元素的最长公共子序列。
2.如果str1[a-1]!=str2[b-1],而且result[c-1]!=str1[a-1],那么就可以肯定,str1[a-1]不在最长公共子序列中,也就是说,result[c-1]及之前的元素就是str1[a-2]之前的元素与str2[b-1]之前的元素的最长公共子序列。
3.如果str1[a-1]!=str2[b-1],而且result[c-1]!=str2[b-1],类似的,就可以肯定,str1[b-1]不在最长公共子序列中,也就是说,result[c-1]及之前的元素就是str1[a-1]之前的元素与str2[b-2]之前的元素的最长公共子序列。
由此,可以得到递归方程。(ps:我不知道在这里如何插入公式,如果您知道,请告诉小弟我,非常感谢!)
max_len[i][j]=0 如果i<=0 || j<=0 (当一个序列长度为0时,也就没有意义)
=1 +max_len[i-1][j-1] 如果str1[i-1]==str2[j-1] (对应上面第1种情况)
=MAX(max_len[i-1][j],max_len[i][j-1]) 如果str1[i-1]!=str2[j-1] (对应上面第2,3种情况)
思路已经很清晰了,代码如下:
最长公共子序列
1 #include <stdio.h> 2 #include <string.h> 3 #define MAX 100 4 5 int max(int num1,int num2); 6 7 //记录a[i],b[j]的最长公共子序列的长度 8 int max_len[MAX+2][MAX+2]={0}; 9 10 char a[MAX]="abcde"; 11 char b[MAX]="afffbcde"; 12 13 int main() 14 { 15 int len_a=strlen(a); 16 int len_b=strlen(b); 17 int result_max=0; 18 int i,j; 19 LCS(len_a,len_b); 20 for(i=1;i<=len_a;i++) 21 { 22 for(j=1;j<=len_b;j++) 23 { 24 if(result_max<=max_len[i][j]) 25 result_max=max_len[i][j]; 26 } 27 } 28 printf("result: %d\n",result_max); 29 return 0; 30 } 31 32 int LCS(int m,int n) 33 { 34 if(m<=0 || n<=0) 35 return 0;
else if(max_len[m][n]!=0)
return max_len[m][n];
36 else if(a[m-1]==b[n-1])
38 return (max_len[m][n]=LCS(m-1,n-1)+1);
40 else
41 return (max(LCS(m,n-1),LCS(m-1,n)));
42 }
43
44 int max(int num1,int num2)
45 {
46 return (num1>num2?num1:num2);
47 }
明天得把具体的最长公共子序列给打印出来。
以下内容补充于2012年12月23日:
昨天留了个问题,就是打印出最长公共子序列。想了一会,没什么思路,就索性把max_len给打印出来,结果一打印我才发现,我把问题想得太复杂了。这本是一个多么简单的问题。
比如str1="abbcd"; str2="afffbcd"; 那么打印出max_len:
1 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 2 0 0
0 0 0 0 0 3 0
0 0 0 0 0 0 4
|
一目了然了。当且仅当str1[a-1]==str2[b-1]时,肯定会使得max_len中对应元素加1.
在程序中加一步就可以了。如下:
1 for(i=1;i<=len_a;i++) 2 { 3 for(j=1;j<=len_b;j++) 4 { 5 if(max_len[i][j]!=0) 6 printf("%c ",a[i-1]); 7 } 8 }
如果您觉得我的文章对您有所帮助,请赞一下,非常感谢!
本文转自NeilHappy 51CTO博客,原文链接:http://blog.51cto.com/neilhappy/1097226,如需转载请自行联系原作者