百度之星之H:用户请求中的品牌

简介: 馅饼同学是一个在百度工作,做用户请求(query)分析的同学,他在用户请求中经常会遇到一些很奇葩的词汇。在比方说“johnsonjohnson”、“duckduck”,这些词汇虽然看起来是一些词汇的单纯重复,但是往往都是一些特殊品牌的词汇,不能被拆分开。为了侦测出这种词的存在,你今天需要完成我给出的这个任务——“找出用户请求中循环节最多的子串”。

馅饼同学是一个在百度工作,做用户请求(query)分析的同学,他在用户请求中经常会遇到一些很奇葩的词汇。在比方说“johnsonjohnson”、“duckduck”,这些词汇虽然看起来是一些词汇的单纯重复,但是往往都是一些特殊品牌的词汇,不能被拆分开。为了侦测出这种词的存在,你今天需要完成我给出的这个任务——“找出用户请求中循环节最多的子串”。

————————————————

版权声明:本文为CSDN博主「铭毅天下」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/laoyang360/article/details/7621172

#include <iostream>

#include <string>

#include <vector>

#include <stdlib.h>

#include <utility>

using namespace std;

 

 

pair<int, string> fun(const string& str)

{

vector<string> substrs;

int maxcount = 1;

int count = 1;

string substr;

 

int i = 0;

int j = 0;

int k = 0;

int len = str.length();

 

string tempStr;

int iLen = 0;

int iCnt = 0;

 

char chTmp;

 

for(i = 0; i < len; ++i)

{

 substrs.push_back(str.substr(i,len-i));

}

 

for(i = 0; i < len; ++i)

{

 for( j = i+1; j < len; ++j)

 {

  count = 1;

  if(substrs[i].substr(0,j-i) == substrs[j].substr(0,j-i))

  {

   ++count;

   for(k = j + (j-i); k < len; k+=(j-i))

   {

    if(substrs[i].substr(0,j-i) == substrs[k].substr(0,j-i))

    {

     ++count;

    }

    else

    {

     break;

    }

   }

 

  }

  if(count > maxcount)

  {

   maxcount = count;

   substr = substrs[i].substr(0,j-i);

   tempStr = substr;  

   iLen = substr.length();

   iCnt = maxcount;

   while(iCnt > 1)

   {

    substr.insert(iLen,tempStr);

    iCnt--;

   }

  }

 }

}

if(substr.length() == 0)

{

 chTmp = (char)str[0];

 for( int i = 1; i < len; i++ )

 {

  if( str[i] < chTmp )

  {

   chTmp = str[i];

  }

 }

 substr = chTmp;

}

return make_pair(maxcount,substr);

}

 

int main(void)

{

string str;

pair<int,string> rs;

int iGroup = 0;

 

while(cin >> str)

{

 if(str == "#")

 {

  break;

 }

 rs = fun(str);

 cout << "Case " << ++iGroup  << ": "<< rs.second << "\n";  

}

 

return 0;

}

注:

0.题目的本质还是求最大子串问题,只是在输出方面有所变动,但“换汤不换药”。


1.此题一致显示Wrong Answer,但对于测试数据都是能通过的。不知道何故,求网友指出原因。


2.此题参考了《程序员面试baodian》里面字符串处理部分的代码,做了相应修正。(源代码有错误!)


3.感觉比下面网友提供的要精炼不少:

————————————————

版权声明:本文为CSDN博主「铭毅天下」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/laoyang360/article/details/7621172

#include<iostream>  

#include<cstdio>  

using namespace std;  

#include<string.h>  

#include<math.h>  

 

int wa[200000],wb[200000],wv[200000],wsum[200000];  

int height[200000],sa[200000],rank[200000];  

int n,ans,len,pos;  

char str[200000];  

int R[200000];  

int f[200000][20];  

int a[200000],num;  

int cmp(int *r,int a,int b,int l)  

{  

   return r[a]==r[b] && r[a+l]==r[b+l];  

}  

void da(int *r,int *sa,int n,int m)   //倍增算法 r为待匹配数组  n为总长度 m为字符范围  

{  

   int i,j,p,*x=wa,*y=wb,*t;  

   for(i=0;i<m;++i)  

       wsum[i]=0;  

   for(i=0;i<n;++i)  

       wsum[x[i]=r[i]]++;  

   for(i=1;i<m;++i)  

       wsum[i]+=wsum[i-1];  

   for(i=n-1;i>=0;--i)  

       sa[--wsum[x[i]]]=i;  

   for(j=1,p=1;p<n;j*=2,m=p)  

   {  

       for(p=0,i=n-j;i<n;++i)  

           y[p++]=i;  

       for(i=0;i<n;++i)  

           if(sa[i]>=j)  

               y[p++]=sa[i]-j;  

       for(i=0;i<n;i++)  

           wv[i]=x[y[i]];  

       for(i=0;i<m;++i)  

           wsum[i]=0;  

       for(i=0;i<n;++i)  

           wsum[wv[i]]++;  

       for(i=1;i<m;i++)  

           wsum[i]+=wsum[i-1];  

       for(i=n-1;i>=0;--i)  

           sa[--wsum[wv[i]]]=y[i];  

       for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;++i)  

           x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  

   }  

}  

void calheight(int *r,int *sa,int n)     //求height数组  

{  

   int i,j,k=0;  

   for(i=0;i<=n;++i)  

       rank[sa[i]]=i;  

   for(i=0;i<n;height[rank[i++]]=k)  

       for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);  

}  

int mmin(int x,int y)  

{  

   return x<y?x:y;  

}  

void rmqinit(int n)     //初始化rmq  

{  

   int i,j,k,m;  

   m=(int)(log(1.0*n)/log(2.0));    

   for(i=1;i<=n;i++)    

       f[i][0]=height[i];    

   for(i=1;i<=m;++i)    

       for(j=n;j>=1;--j)    

       {    

           f[j][i]=f[j][i-1];    

           k=1<<(i-1);    

           if(j+k<=n)    

               f[j][i]=mmin(f[j][i],f[j+k][i-1]);    

       }    

}  

int get_rmq(int x , int y)    //询问x、y后缀的最长公共前缀    

{    

   int m,t;    

   x=rank[x] , y=rank[y];    

   if(x>y)      

       t=x,x=y,y=t;      

   ++x;      

   m=(int)(log(1.0*(y-x+1))/log(2.0));      

   return mmin(f[x][m],f[y-(1<<m)+1][m]);      

}  

int main(void)  

{  

   int i,j,k,ca=0,l,s,t,p,cnt;  

   char c;  

   while(scanf("%s",str)!=EOF)  

   {  

       if(str[0]=='#')  

           break;  

       n=strlen(str);  

       for(i=0;i<n;++i)  

           R[i]=str[i]-'a'+1;  

       R[n]=0;  

       da(R,sa,n+1,28);  

       calheight(R,sa,n);  

       rmqinit(n);  

       ans=1;  

       num=0;  

       pos=0;  

       for(l=1;l<=n/2;++l)            //枚举长度  

       {  

           for(i=0;i<n-l;i+=l)  

           {  

               if(str[i]!=str[i+l])  

                   continue;  

               k=get_rmq(i,i+l);  

               s=k/l+1;  

               p=i;  

               t=l-k%l;  

               cnt=0;  

               for(j=i-1;j>=0 && j>i-l && str[j]==str[j+l];j--)  

               {  

                   ++cnt;  

                   if(cnt==t)  

                       s++ , p=j;  

                   else if(rank[j]<rank[p])  

                       p=j;  

               }  

               if(ans<s)  

               {  

                   pos=p;  

                   len=s*l;  

                   ans=s;  

 

               }  

               else if(ans==s && rank[pos]>rank[p])  

               {  

                   pos=p;  

                   len=s*l;  

               }  

 

           }  

       }  

       printf("Case %d: ",++ca);  

       if(ans<2)  

       {  

           c='z';  

            for(i=0;i<n;++i)  

                if(str[i]<c)  

                    c=str[i];  

            printf("%c\n",c);  

            continue;  

       }  

       for(i=0;i<len;++i)  

           printf("%c",str[i+pos]);  

       puts("");  

   }  

   return 0;  

}  

相关文章
|
11天前
|
人工智能 安全 搜索推荐
QQ智能体与代理IP:探索社交新纪元的技术双翼
在数字化时代,QQ智能体和代理IP正成为社交领域的新宠。QQ智能体是基于AI的聊天机器人,通过腾讯元器平台创建,提升用户社交体验并提供个性化服务。代理IP则通过隐藏真实IP地址保护隐私,突破地域限制。两者结合推动智能营销,为品牌与用户互动开辟新路径。未来,这两项技术将带来更智能、安全的社交体验。 简介:本文深入探讨QQ智能体和代理IP的技术原理、应用场景及发展趋势,旨在帮助读者理解其在社交领域的无限可能。
25 1
|
数据采集 搜索推荐 安全
为什么谷歌关键词上不去首页?
答案是:缺少GPB外链对外贸官网权重的提升。 选择合适的关键词 选择合适的关键词是Google优化的第一步。 关键词需要反映网站的核心内容,并且与目标受众的搜索习惯相匹配。 错误的关键词选择 如果选择了与网站内容不匹配或竞争过于激烈的关键词,可能会导致关键词在谷歌搜索结果中排名较低。 外链建设:GPB外链的作用 通过使用GPB外链,可以有效提升谷歌搜索引擎的自然排名。 GPB外链是高质量的独立站外链,与许多成功的Google优化项目有关联。
97 0
为什么谷歌关键词上不去首页?
|
数据采集 搜索推荐 SEO
谷歌关键词排名上不了首页是怎么回事?
答案是:缺少GPB外链对外贸官网权重的提升。 关键词选择不当 可能你选择的关键词竞争过于激烈,这就需要更多的优化和工作量才能提升排名。 或者,你选择的关键词与你的网站内容不匹配,搜索引擎可能会认为你的网站并不能提供用户真正想要的内容,从而影响排名。 选词不当的在线服饰店 比如,你的网站是一个在线销售韩国时尚服饰的店铺,但是你选择的关键词可能是“韩国最新流行歌曲”,这显然与你网站的主题不符,搜索引擎无法将你的网站与这个关键词相匹配,从而导致你的关键词排名上不了首页。
105 0
谷歌关键词排名上不了首页是怎么回事?
|
8月前
|
小程序
支付宝搜索「品牌直达」怎么玩?看这几位“神”操作
支付宝搜索「品牌直达」怎么玩?看这几位“神”操作
91 11
|
8月前
|
监控 搜索推荐 数据挖掘
淘宝关键词设置:技巧与实战指南
淘宝关键词设置:技巧与实战指南
|
搜索推荐 SEO
谷歌关键词排名上首页需要多久【2023年实战数据】
因为你做的外链或内容都只是你觉得所谓的“优质”,你觉得的不一定就是优质,因为数据不会骗人,网站没排名,一切等于零。
215 0
谷歌关键词排名上首页需要多久【2023年实战数据】
|
人工智能 算法
智能logo免费体验|如何让餐饮logo在点评网站上一眼出众?
一个新的餐饮店铺,还没有人知晓,Logo就是这个重要的“门面”,所传递的信息让人快速识别,就能产生记忆点,愿意进一步了解,从而为店铺带来流量和收益。如何让你的餐饮店铺logo具备吸引力,在茫茫竞争中一眼出众,为你带来生意呢? 阿里云智能logo设计,在线免费体验logo制作:https://logo.aliyun.com/logo
508 0
智能logo免费体验|如何让餐饮logo在点评网站上一眼出众?
|
人工智能 自然语言处理 算法
|
新零售 人工智能 搜索推荐
从百度沸点看互联网的未来:智能、企业级、内容、消费和人文
从百度沸点看互联网的未来:智能、企业级、内容、消费和人文
204 0
从百度沸点看互联网的未来:智能、企业级、内容、消费和人文
|
算法 搜索推荐 SEO
2010年下半年百度关键词排名成功密绝揭发
可以说百度的算法一直在变,但是有很多东西却是不变的,抓住这些,就能够让关键词在百度获得良好排名。看看眼前,多少站长心爱的站被K,被降权,关键词排名下降或消失。多少人举步维艰,站长这一行的确是天下最不安稳和确定的行业。但是,站长又是快乐的,看到自己的想法一点点实现,那种快乐是难以言表的。
110 0

热门文章

最新文章