算法——bing字典问题-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

算法——bing字典问题

简介: 本届大赛由微软必应词典冠名,必应词典(Bing Dictionary)是微软推出的新一代英语学习引擎,里面收录了很多我们常见的单词。但现实生活中,我们也经常能看到一些毫无规则的字符串,导致词典无法正常收录,不过,我们是否可以从无规则的字符串中提取出正规的单词呢? 例如有一个字符串"iinbinbing",截取不同位置的字符‘b’、‘i’、‘n’、‘g’组合成单词"bing"。

本届大赛由微软必应词典冠名,必应词典(Bing Dictionary)是微软推出的新一代英语学习引擎,里面收录了很多我们常见的单词。但现实生活中,我们也经常能看到一些毫无规则的字符串,导致词典无法正常收录,不过,我们是否可以从无规则的字符串中提取出正规的单词呢?

例如有一个字符串"iinbinbing",截取不同位置的字符‘b’、‘i’、‘n’、‘g’组合成单词"bing"。若从1开始计数的话,则‘b’ ‘i’ ‘n’ ‘g’这4个字母出现的位置分别为(4,5,6,10) (4,5,9,10),(4,8,9,10)和(7,8,9,10),故总共可以组合成4个单词”bing“。

咱们的问题是:现给定任意字符串,只包含小写‘b’ ‘i’ ‘n’ ‘g’这4种字母,请问一共能组合成多少个单词bing?

字符串长度不超过10000,由于结果可能比较大,请输出对10^9 + 7取余数之后的结果。


我的做法是:

(1)将b、i、n、g分别放入四个桶中(实际放的不是这些字符),每个桶有个记录桶内当前字符数量的变量num(初始值为0),桶内的每个元素记录的内容是这样的:

如果是b桶,那么里面的元素记录的是这个b字符后面的第一个i字符在桶i内的索引(桶的索引从0开始,也就是桶的num变量值)

如果是i桶,那么里面的元素记录的是这个i字符后面的第一个n字符在桶n内的索引;

如果是n桶,那么里面的元素记录的是这个n字符后面的第一个g字符在桶g内的索引;

g桶只需要记录桶内的字符数量即可;

桶内每插入一个元素,桶的num变量+1.

这可以通过一次从前向后扫描字符串得到,这部分的复杂度为O(n),以题目中的"iinbinbing"为例,桶的构建结果如下:



(2)根据(1)计算数量,以这个例子进行说明:

3个n字符后面的g字符数量为1-0=1(桶g的num值减去这个n字符对应位置保存的桶g的索引值)

第2个n字符后面的g字符数量为1-0=1 

第1个n字符后面的g字符数量为1-0=1 

        并用计算出来的这些值代替桶中原来的值,如下:


第4个i字符后面的n,g序列的数量为:for j=2 to 3-1 :sum(n[j]) = 1

3i字符后面的n,g序列的数量为:for j=1 to 3-1 :sum(n[j]) = 1+1 =2

第2个i字符后面的n,g序列的数量为:for j=0 to 3-1 :sum(n[j]) = 1+1+1 =3

第1个i字符后面的n,g序列的数量为:for j=0 to 3-1 :sum(n[j]) = 1+1+1 =3

并用计算出来的这些值代替桶中原来的值,如下:

       

第2个b字符后面的i,n,g序列的数量为:for j=3 to 4-1 :sum(i[j]) = 2+1 =3

第1个b字符后面的i,n,g序列的数量为:for j=2 to 4-1 :sum(i[j]) = 1

那么结果就是3+1=4。

到这里你应该明白了计算过程。

这个计算过程可以优化:每个循环可以利用上一个循环的计算结果加上本次循环需要增加的量来计算:

比如计算“第3个i字符后面的n,g序列的数量为”,可以通过第4个i字符后面的n,g序列的数量+增加的量来计算。

优化后计算过程的复杂度也为O(n)。

(3)综上复杂度为O(n)

(4)代码如下,计算部分未优化:

  1. #include <stdio.h>  
  2. #include <iostream>  
  3. #include <string>  
  4. using namespace std;  
  5. class Test {  
  6. public:  
  7.     static int howmany (string   s){  
  8.         int div=1000000007;  
  9.         long long res=0;  
  10.         int *tmp[4];//其实3个就可以了  
  11.         int nums[4];  
  12.         for(int i=0;i<=3;++i){  
  13.             tmp[i]=new int[s.size()+1];  //  
  14.             nums[i]=0;  
  15.         }  
  16.         for(int i=0;i<=s.size();++i){//可以使用memset,会更快点  
  17.             tmp[0][i]=0;  
  18.             tmp[1][i]=0;  
  19.             tmp[2][i]=0;  
  20.             tmp[3][i]=0;  
  21.         }  
  22.         for(int i=0;i<s.size();++i){  
  23.             if(s[i]=='b'){  
  24.                 tmp[0][nums[0]]=nums[1];  
  25.                 ++nums[0];  
  26.             }else if (s[i]=='i'){  
  27.                 //可以优化  
  28.                 tmp[1][nums[1]]=nums[2];  
  29.                 ++nums[1];  
  30.             }else if(s[i]=='n'){  
  31.                 tmp[2][nums[2]]=nums[3];  
  32.                 ++nums[2];  
  33.             }else {  
  34.                 ++nums[3];  
  35.             }  
  36.         }  
  37.         for(int i=nums[2]-1;i>=0;--i){  
  38.             tmp[2][i]=nums[3]-tmp[2][i];  
  39.         }  
  40.         for(int i=nums[1]-1;i>=0;--i){  
  41.             int j=tmp[1][i];  
  42.             tmp[1][i]=0;  
  43.             for(;j<nums[2];++j){  
  44.                 //这里可以优化,可以减少加法的次数  
  45.                 //通过利用tmp[1][i+1]的值  
  46.                 tmp[1][i]+=tmp[2][j];  
  47.             }  
  48.         }  
  49.         long long t=0;  
  50.         for(int i=nums[0]-1;i>=0;--i){  
  51.             int j=tmp[0][i];  
  52.             for(;j<nums[1];++j){  
  53.                 //这里可以优化,可以减少加法的次数  
  54.                 //通过利用上一次i循环的t的值  
  55.                 t+=tmp[1][j];  
  56.                 t%=div;  
  57.             }  
  58.         }  
  59.         return t;  
  60.     }  
  61. };  
  62. //start 提示:自动阅卷起始唯一标识,请勿删除或增加。  
  63. int main()  
  64. {     
  65.     cout<<Test::howmany("iinbinbing")<<endl;     
  66. }   
  67. //end //提示:自动阅卷结束唯一标识,请勿删除或增加。  
  1. public class Test   
  2. {   
  3.    public static int howmany(String s){  
  4.         int bNum = 0;  
  5.         int biNum = 0;  
  6.         int binNum = 0;  
  7.         int bingNum = 0;  
  8.         for(int i=0;i<s.length();i++){  
  9.             switch (s.charAt(i)) {  
  10.             case 'b':bNum++;break;  
  11.             case 'i':biNum=biNum%1000000007+bNum; break;  
  12.             case 'n':binNum = binNum%1000000007+biNum;    break;  
  13.             case 'g':bingNum = bingNum%1000000007+binNum; break;  
  14.             default:  
  15.                 break;  
  16.             }  
  17.         }  
  18.         return bingNum%1000000007;  
  19.     }  
  20.     //start 提示:自动阅卷起始唯一标识,请勿删除或增加。   
  21.     public static void main(String args[])   
  22.     {   
  23.        System.out.println(howmany("binbinggg"));  
  24.     }   
  25.     //end //提示:自动阅卷结束唯一标识,请勿删除或增加。  
  26. }          

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章