华为机试HJ63:DNA序列

简介: 华为机试HJ63:DNA序列

题目描述:

一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。


给定一个很长的DNA序列,以及限定的子串长度N,请帮助研究人员在给出的DNA序列中从左往右找出GC-Ratio最高且长度为N的第一个子串。


DNA序列为ACGT的子串有:ACG,CG,CGT等等,但是没有AGT,CT等等

输入描述:

输入一个string型基因序列,和int型子串的长度

输出描述:

找出GC比例最高的子串,如果有多个则输出第一个的子串

示例:

输入:

ACGT

2


输出:

CG


说明:

ACGT长度为2的子串有AC,CG,GT3个,其中AC和GT2个的GC-Ratio都为0.5,CG为1,故输出CG

解题思路:

本题为字符串操作题。输入string基因序列和子串长度后,挨个子串分析GC的比例,定位出最大GC-Ratio的子串输出即可。

测试代码:

#include <iostream>
#include <string>
#include <vector>
using namespace std;
int main()
{
    string str;
    int length;
    while(cin>>str>>length)
    {
        vector<string> ls;
        int size=str.size();
        float max=0.f;
        string result;
        for(int i=0;i<size-length+1;++i)
        {
            string t=str.substr(i,length);
            float sum=0.f;
            for(int j=0;j<t.size();++j)
            {
                if(t[j]=='G'||t[j]=='C')
                    sum++;
            }
            float R=float(sum/t.size());
            if(R>max)
            {
                max=R;
                result=t;
            }
        }
        cout<<result<<endl;
    }
    return 0;
}
相关文章
|
6月前
【每日一题Day369】LC187重复的DNA序列 | 字符串哈希
【每日一题Day369】LC187重复的DNA序列 | 字符串哈希
46 1
华为机试HJ107:求解立方根
华为机试HJ107:求解立方根
148 1
|
Serverless 测试技术
华为机试HJ97:记负均正
华为机试HJ97:记负均正
131 1
华为机试HJ105:记负均正II
华为机试HJ105:记负均正II
119 1
|
算法
华为机试HJ82:将真分数分解为埃及分数
华为机试HJ82:将真分数分解为埃及分数
|
大数据 测试技术 索引
华为机试HJ25:数据分类处理
华为机试HJ25:数据分类处理
华为机试HJ75:公共子串计算
华为机试HJ75:公共子串计算
|
机器学习/深度学习
华为机试HJ53:杨辉三角的变形
华为机试HJ53:杨辉三角的变形