蓝桥杯 蓝肽子序列 python(2020动态规划)
题目描述
L 星球上的生物由蛋蓝质组成,每一种蛋蓝质由一类称为蓝肽的物资首尾连接成一条长链后折叠而成。
生物学家小乔正在研究 L 星球上的蛋蓝质。她拿到两个蛋蓝质的蓝肽序列,想通过这两条蓝肽序列的共同特点来分析两种蛋蓝质的相似性。
具体的,一个蓝肽可以使用 11 至 55 个英文字母表示,其中第一个字母大写,后面的字母小写。一个蛋蓝质的蓝肽序列可以用蓝肽的表示顺序拼接而成。
在一条蓝肽序列中,如果选取其中的一些位置,把这些位置的蓝肽取出,并按照它们在原序列中的位置摆放,则称为这条蓝肽的一个子序列。蓝肽的子序列不一定在原序列中是连续的,中间可能间隔着一些未被取出的蓝肽。
如果第一条蓝肽序列可以取出一个子序列与第二条蓝肽序列中取出的某个子序列相等,则称为一个公共蓝肽子序列。
给定两条蓝肽序列,找出他们最长的那个公共蓝肽子序列的长度。
输入描述
输入两行,每行包含一个字符串,表示一个蓝肽序列。字符串中间没有空格等分隔字符。
其中有 ,两个字符串的长度均不超过 10001000。
输出描述
输出一个整数,表示最长的那个公共蓝肽子序列的长度。
输入输出样例
示例
输入
LanQiaoBei LanTaiXiaoQiao
输出
2
运行限制
- 最大运行时间:1s
- 最大运行内存: 128M
思路
这道题和寻找两个字符串之间最长的公共子序列的做法是完全一样的。不同的就是此处的蓝肽并不是字母,我们把它看作字母来做就好了。
在进行查找之前,我们要对蓝肽蛋白质进行处理,也就是将蓝肽蛋白质中的蓝肽分开。
通过分析蓝肽的特点,每个蓝肽的首字母是大写的,之后的为小写。
所以一开始先分割单词序列,得到两个序列的单词序列,然后接下来我们按照寻找两个字符串之间最长的公共子序列的做法去做就好了。
建立一个大小为( n + 1 ) ∗ ( m + 1 )二维数组d p dpdp,其中d p [ i ] [ j ] 代表当s取到i,t取到j时两者的最长公共子串的长度
最后输出 dp[n][m]即可得到答案
# https://www.lanqiao.cn/problems/1030/learning/ s1 = input() s2 = input() S1,S2 = [],[] a,b = '','' # 分割单词 for s in s1: if 'A' <= s <= 'Z': if a!= '': S1.append(a) a = '' a += s S1.append(a) for s in s2: if 'A' <= s <= 'Z': if b!= '': S2.append(b) b = '' b += s S2.append(b) # print(S1,S2) # 两个序列的单词长度 n = len(S1) m = len(S2) dp = [[0]*(m+1) for _ in range(n+1)] # 动态规划的求解最大公共序列 for i in range(1,n+1): for j in range(1,m+1): if S1[i-1] == S2[j-1]: dp[i][j] = dp[i-1][j-1] + 1 # 有相同的,序列+1 else: dp[i][j] = max(dp[i-1][j],dp[i][j-1]) # 取最长那个单词序列 print(dp[n][m])