大家好,我是小魔龙,Unity3D软件工程师,VR、AR,虚拟仿真方向,不定时更新软件开发技巧,生活感悟,觉得有用记得一键三连哦。
一、题目
1、算法题目
“给定一个标识DNA蓄力的字符串s,返回所有在DNA分子中出现不止一次的长度为10的序列。”
2、题目描述
DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
- 例如,"ACGAATTCCG" 是一个 DNA序列 。 在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1: 输入: s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT" 输出: ["AAAAACCCCC","CCCCCAAAAA"]
示例 2: 输入: s = "AAAAAAAAAAAAA" 输出: ["AAAAAAAAAA"]
二、解题
1、思路分析
这道题是要求出重复的字符串s,重复的元素容易想到的就是使用哈希表。
键是字符串的子串,值是出现的次数,返回所有次数出现超过10次的子串即可。
2、代码实现
代码参考:
class Solution { static final int L = 10; public List<String> findRepeatedDnaSequences(String s) { List<String> ans = new ArrayList<String>(); Map<String, Integer> cnt = new HashMap<String, Integer>(); int n = s.length(); for (int i = 0; i <= n - L; ++i) { String sub = s.substring(i, i + L); cnt.put(sub, cnt.getOrDefault(sub, 0) + 1); if (cnt.get(sub) == 2) { ans.add(sub); } } return ans; } }
3、时间复杂度
时间复杂度:O(NL)
其中N是字符串s的长度,L=10即目标子串的长度。
空间复杂度:O(NL)
其中N是字符串s的长度,L是目标子串的长度。
三、总结
这道题还可以使用滑动窗口来优化时间复杂度。
当前时间复杂度是O(NL),其中N是字符串s的长度,L是目标子串的长度。
为了优化时间复杂度,可以定义一个大小为10的滑动窗口来计算子串的整数,设当前滑动窗口对应的整数表示为x。
当计算下一个子串时,将滑动窗口向右移动一位,此时新字符进入窗口,窗口左边的字符离开窗口。
将上面的步骤结合,就可以用O(1)的时间计算出下一个子串的整数表示。