百度之星之H:用户请求中的品牌

简介: 找出用户请求中循环节最多的子串详解

时间限制:

1000ms

内存限制:

65536kB

描述

馅饼同学是一个在百度工作,做用户请求(query)分析的同学,他在用户请求中经常会遇到一些很奇葩的词汇。在比方说“johnsonjohnson”、“duckduck”,这些词汇虽然看起来是一些词汇的单纯重复,但是往往都是一些特殊品牌的词汇,不能被拆分开。为了侦测出这种词的存在,你今天需要完成我给出的这个任务——“找出用户请求中循环节最多的子串”。

输入

输入数据包括多组,每组为一个全部由小写字母组成的不含空格的用户请求(字符串),占一行。用户请求的长度不大于100,000。
最后一行输入为#,作为结束的标志。

输出

对于每组输入,先输出这个组的编号(第n组就是输出“Case n:”);然后输出这组用户请求中循环节最多的子串。如果一个用户请求中有两个循环节数相同的子串,请选择那个字典序最小的。

样例输入

ilovejohnsonjohnsonverymuch

duckduckgo

aaabbbcccisagoodcompany

#

样例输出

Case 1: johnsonjohnson

Case 2: duckduck

Case 3: aaa

 

【答案】

#include <iostream>
#include <string>
#include <vector>
#include <stdlib.h>
#include <utility>
using namespace std;
 
 
pair<int, string> fun(const string& str)
{
    vector<string> substrs;
    int maxcount = 1;
    int count = 1;
    string substr;
    
    int i = 0;
    int j = 0;
    int k = 0;
    int len = str.length();
    
    string tempStr;
    int iLen = 0;
    int iCnt = 0;
 
    char chTmp;
    
    for(i = 0; i < len; ++i)
    {
        substrs.push_back(str.substr(i,len-i));
    }
    
    for(i = 0; i < len; ++i)
    {
        for( j = i+1; j < len; ++j)
        {
            count = 1;
            if(substrs[i].substr(0,j-i) == substrs[j].substr(0,j-i))
            {
                ++count;
                for(k = j + (j-i); k < len; k+=(j-i))
                {
                    if(substrs[i].substr(0,j-i) == substrs[k].substr(0,j-i))
                    {
                        ++count;
                    }
                    else
                    {
                        break;
                    }
                }
                
            }
            if(count > maxcount)
            {
                maxcount = count;
                substr = substrs[i].substr(0,j-i);
                tempStr = substr;    
                iLen = substr.length();
                iCnt = maxcount;
                while(iCnt > 1)
                {
                    substr.insert(iLen,tempStr);
                    iCnt--;
                }
            }
        }
    }
    if(substr.length() == 0)
    {
        chTmp = (char)str[0];
        for( int i = 1; i < len; i++ )
        {
            if( str[i] < chTmp )
            {
                chTmp = str[i];
            }
        }
        substr = chTmp;
    }
    return make_pair(maxcount,substr);
}
 
int main(void)
{
    string str;
    pair<int,string> rs;
    int iGroup = 0;
    
    while(cin >> str)
    {
        if(str == "#")
        {
            break;
        }
        rs = fun(str);
        cout << "Case " << ++iGroup  << ": "<< rs.second << "\n";     
    }
 
    return 0;
}

注:
0.题目的本质还是求最大子串问题,只是在输出方面有所变动,但“换汤不换药”。

1.此题一致显示Wrong Answer,但对于测试数据都是能通过的。不知道何故,求网友指出原因。

2.此题参考了《程序员面试baodian》里面字符串处理部分的代码,做了相应修正。(源代码有错误!)

3.感觉比下面网友提供的要精炼不少:

#include<iostream>  
#include<cstdio>  
using namespace std;  
#include<string.h>  
#include<math.h>  
  
int wa[200000],wb[200000],wv[200000],wsum[200000];  
int height[200000],sa[200000],rank[200000];  
int n,ans,len,pos;  
char str[200000];  
int R[200000];  
int f[200000][20];  
int a[200000],num;  
int cmp(int *r,int a,int b,int l)  
{  
    return r[a]==r[b] && r[a+l]==r[b+l];  
}  
void da(int *r,int *sa,int n,int m)   //倍增算法 r为待匹配数组  n为总长度 m为字符范围  
{  
    int i,j,p,*x=wa,*y=wb,*t;  
    for(i=0;i<m;++i)  
        wsum[i]=0;  
    for(i=0;i<n;++i)  
        wsum[x[i]=r[i]]++;  
    for(i=1;i<m;++i)  
        wsum[i]+=wsum[i-1];  
    for(i=n-1;i>=0;--i)  
        sa[--wsum[x[i]]]=i;  
    for(j=1,p=1;p<n;j*=2,m=p)  
    {  
        for(p=0,i=n-j;i<n;++i)  
            y[p++]=i;  
        for(i=0;i<n;++i)  
            if(sa[i]>=j)  
                y[p++]=sa[i]-j;  
        for(i=0;i<n;i++)  
            wv[i]=x[y[i]];  
        for(i=0;i<m;++i)  
            wsum[i]=0;  
        for(i=0;i<n;++i)  
            wsum[wv[i]]++;  
        for(i=1;i<m;i++)  
            wsum[i]+=wsum[i-1];  
        for(i=n-1;i>=0;--i)  
            sa[--wsum[wv[i]]]=y[i];  
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;++i)  
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  
    }  
}  
void calheight(int *r,int *sa,int n)     //求height数组  
{  
    int i,j,k=0;  
    for(i=0;i<=n;++i)  
        rank[sa[i]]=i;  
    for(i=0;i<n;height[rank[i++]]=k)  
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);  
}  
int mmin(int x,int y)  
{  
    return x<y?x:y;  
}  
void rmqinit(int n)     //初始化rmq  
{  
    int i,j,k,m;  
    m=(int)(log(1.0*n)/log(2.0));   
    for(i=1;i<=n;i++)   
        f[i][0]=height[i];   
    for(i=1;i<=m;++i)   
        for(j=n;j>=1;--j)   
        {   
            f[j][i]=f[j][i-1];   
            k=1<<(i-1);   
            if(j+k<=n)   
                f[j][i]=mmin(f[j][i],f[j+k][i-1]);   
        }   
}  
int get_rmq(int x , int y)    //询问x、y后缀的最长公共前缀    
{   
    int m,t;   
    x=rank[x] , y=rank[y];   
    if(x>y)     
        t=x,x=y,y=t;     
    ++x;     
    m=(int)(log(1.0*(y-x+1))/log(2.0));     
    return mmin(f[x][m],f[y-(1<<m)+1][m]);     
}  
int main(void)  
{  
    int i,j,k,ca=0,l,s,t,p,cnt;  
    char c;  
    while(scanf("%s",str)!=EOF)  
    {  
        if(str[0]=='#')  
            break;  
        n=strlen(str);  
        for(i=0;i<n;++i)  
            R[i]=str[i]-'a'+1;  
        R[n]=0;  
        da(R,sa,n+1,28);  
        calheight(R,sa,n);  
        rmqinit(n);  
        ans=1;  
        num=0;  
        pos=0;  
        for(l=1;l<=n/2;++l)            //枚举长度  
        {  
            for(i=0;i<n-l;i+=l)  
            {  
                if(str[i]!=str[i+l])  
                    continue;  
                k=get_rmq(i,i+l);  
                s=k/l+1;  
                p=i;  
                t=l-k%l;  
                cnt=0;  
                for(j=i-1;j>=0 && j>i-l && str[j]==str[j+l];j--)  
                {  
                    ++cnt;  
                    if(cnt==t)  
                        s++ , p=j;  
                    else if(rank[j]<rank[p])  
                        p=j;  
                }  
                if(ans<s)  
                {  
                    pos=p;  
                    len=s*l;  
                    ans=s;  
  
                }  
                else if(ans==s && rank[pos]>rank[p])  
                {  
                    pos=p;  
                    len=s*l;  
                }  
  
            }  
        }  
        printf("Case %d: ",++ca);  
        if(ans<2)  
        {  
            c='z';  
             for(i=0;i<n;++i)  
                 if(str[i]<c)  
                     c=str[i];  
             printf("%c\n",c);  
             continue;  
        }  
        for(i=0;i<len;++i)  
            printf("%c",str[i+pos]);  
        puts("");  
    }  
    return 0;  
} 

作者:铭毅天下
原文:https://blog.csdn.net/laoyang360/article/details/7621172
版权声明:本文为博主原创文章,转载请附上博文链接!

相关文章
|
2天前
|
云安全 人工智能
2025,阿里云安全的“年度报告”
拥抱AI时代,阿里云安全为你护航~
1439 1
|
9天前
|
云安全 人工智能 算法
以“AI对抗AI”,阿里云验证码进入2.0时代
三层立体防护,用大模型打赢人机攻防战
1415 10
|
9天前
|
机器学习/深度学习 安全 API
MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!
MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。
1330 7
|
10天前
|
人工智能 Rust 运维
这个神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
加我进AI讨论学习群,公众号右下角“联系方式”文末有老金的 开源知识库地址·全免费
1215 15
|
4天前
|
人工智能 前端开发 API
Google发布50页AI Agent白皮书,老金帮你提炼10个核心要点
老金分享Google最新AI Agent指南:让AI从“动嘴”到“动手”。Agent=大脑(模型)+手(工具)+协调系统,可自主完成任务。通过ReAct模式、多Agent协作与RAG等技术,实现真正自动化。入门推荐LangChain,文末附开源知识库链接。
455 118
|
2天前
|
机器学习/深度学习 测试技术 数据中心
九坤量化开源IQuest-Coder-V1,代码大模型进入“流式”训练时代
2026年首日,九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型,涵盖7B至40B参数,支持128K上下文与GQA架构,提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式,模拟代码演化全过程,提升复杂任务推理能力,在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放,支持本地部署与微调,助力研究与应用落地。
334 1
|
7天前
|
存储 缓存 NoSQL
阿里云经济型e实例(ecs.e-c1m4.large)2核8G云服务器优惠活动价格及性能测评
阿里云经济型e实例(ecs.e-c1m4.large)2核8G配置,支持按使用流量或按固定带宽两种公网计费方式,搭配20G起ESSD Entry云盘,是主打高性价比的内存优化型入门选择。其核心特点是8G大内存适配轻量内存密集场景,计费模式灵活可控,既能满足个人开发者的复杂测试项目需求,也能支撑小微企业的基础业务运行,无需为闲置资源过度付费。以下从优惠活动价格、性能表现、适用场景及避坑要点四方面,用通俗语言详细解析。
233 153
|
4天前
|
机器学习/深度学习 人工智能 算法
炎鹊「Nexus Agent V1.0」:垂直领域AI应用的原生能力引擎
炎鹊AI「Nexus Agent V1.0」是垂直行业专属AI原生引擎,融合大模型、AIGA决策大脑、行业知识图谱与专属模型,打造“感知-决策-执行”闭环。支持21个行业低代码构建工具型、员工型、决策型AI应用,实现技术到业务价值的高效转化,推动AI从实验走向规模化落地。(239字)
253 1

热门文章

最新文章