算法——bing字典问题

简介: 本届大赛由微软必应词典冠名,必应词典(Bing Dictionary)是微软推出的新一代英语学习引擎,里面收录了很多我们常见的单词。但现实生活中,我们也经常能看到一些毫无规则的字符串,导致词典无法正常收录,不过,我们是否可以从无规则的字符串中提取出正规的单词呢? 例如有一个字符串"iinbinbing",截取不同位置的字符‘b’、‘i’、‘n’、‘g’组合成单词"bing"。

本届大赛由微软必应词典冠名,必应词典(Bing Dictionary)是微软推出的新一代英语学习引擎,里面收录了很多我们常见的单词。但现实生活中,我们也经常能看到一些毫无规则的字符串,导致词典无法正常收录,不过,我们是否可以从无规则的字符串中提取出正规的单词呢?

例如有一个字符串"iinbinbing",截取不同位置的字符‘b’、‘i’、‘n’、‘g’组合成单词"bing"。若从1开始计数的话,则‘b’ ‘i’ ‘n’ ‘g’这4个字母出现的位置分别为(4,5,6,10) (4,5,9,10),(4,8,9,10)和(7,8,9,10),故总共可以组合成4个单词”bing“。

咱们的问题是:现给定任意字符串,只包含小写‘b’ ‘i’ ‘n’ ‘g’这4种字母,请问一共能组合成多少个单词bing?

字符串长度不超过10000,由于结果可能比较大,请输出对10^9 + 7取余数之后的结果。


我的做法是:

(1)将b、i、n、g分别放入四个桶中(实际放的不是这些字符),每个桶有个记录桶内当前字符数量的变量num(初始值为0),桶内的每个元素记录的内容是这样的:

如果是b桶,那么里面的元素记录的是这个b字符后面的第一个i字符在桶i内的索引(桶的索引从0开始,也就是桶的num变量值)

如果是i桶,那么里面的元素记录的是这个i字符后面的第一个n字符在桶n内的索引;

如果是n桶,那么里面的元素记录的是这个n字符后面的第一个g字符在桶g内的索引;

g桶只需要记录桶内的字符数量即可;

桶内每插入一个元素,桶的num变量+1.

这可以通过一次从前向后扫描字符串得到,这部分的复杂度为O(n),以题目中的"iinbinbing"为例,桶的构建结果如下:



(2)根据(1)计算数量,以这个例子进行说明:

3个n字符后面的g字符数量为1-0=1(桶g的num值减去这个n字符对应位置保存的桶g的索引值)

第2个n字符后面的g字符数量为1-0=1 

第1个n字符后面的g字符数量为1-0=1 

        并用计算出来的这些值代替桶中原来的值,如下:


第4个i字符后面的n,g序列的数量为:for j=2 to 3-1 :sum(n[j]) = 1

3i字符后面的n,g序列的数量为:for j=1 to 3-1 :sum(n[j]) = 1+1 =2

第2个i字符后面的n,g序列的数量为:for j=0 to 3-1 :sum(n[j]) = 1+1+1 =3

第1个i字符后面的n,g序列的数量为:for j=0 to 3-1 :sum(n[j]) = 1+1+1 =3

并用计算出来的这些值代替桶中原来的值,如下:

       

第2个b字符后面的i,n,g序列的数量为:for j=3 to 4-1 :sum(i[j]) = 2+1 =3

第1个b字符后面的i,n,g序列的数量为:for j=2 to 4-1 :sum(i[j]) = 1

那么结果就是3+1=4。

到这里你应该明白了计算过程。

这个计算过程可以优化:每个循环可以利用上一个循环的计算结果加上本次循环需要增加的量来计算:

比如计算“第3个i字符后面的n,g序列的数量为”,可以通过第4个i字符后面的n,g序列的数量+增加的量来计算。

优化后计算过程的复杂度也为O(n)。

(3)综上复杂度为O(n)

(4)代码如下,计算部分未优化:

[cpp]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. #include <stdio.h>  
  2. #include <iostream>  
  3. #include <string>  
  4. using namespace std;  
  5. class Test {  
  6. public:  
  7.     static int howmany (string   s){  
  8.         int div=1000000007;  
  9.         long long res=0;  
  10.         int *tmp[4];//其实3个就可以了  
  11.         int nums[4];  
  12.         for(int i=0;i<=3;++i){  
  13.             tmp[i]=new int[s.size()+1];  //  
  14.             nums[i]=0;  
  15.         }  
  16.         for(int i=0;i<=s.size();++i){//可以使用memset,会更快点  
  17.             tmp[0][i]=0;  
  18.             tmp[1][i]=0;  
  19.             tmp[2][i]=0;  
  20.             tmp[3][i]=0;  
  21.         }  
  22.         for(int i=0;i<s.size();++i){  
  23.             if(s[i]=='b'){  
  24.                 tmp[0][nums[0]]=nums[1];  
  25.                 ++nums[0];  
  26.             }else if (s[i]=='i'){  
  27.                 //可以优化  
  28.                 tmp[1][nums[1]]=nums[2];  
  29.                 ++nums[1];  
  30.             }else if(s[i]=='n'){  
  31.                 tmp[2][nums[2]]=nums[3];  
  32.                 ++nums[2];  
  33.             }else {  
  34.                 ++nums[3];  
  35.             }  
  36.         }  
  37.         for(int i=nums[2]-1;i>=0;--i){  
  38.             tmp[2][i]=nums[3]-tmp[2][i];  
  39.         }  
  40.         for(int i=nums[1]-1;i>=0;--i){  
  41.             int j=tmp[1][i];  
  42.             tmp[1][i]=0;  
  43.             for(;j<nums[2];++j){  
  44.                 //这里可以优化,可以减少加法的次数  
  45.                 //通过利用tmp[1][i+1]的值  
  46.                 tmp[1][i]+=tmp[2][j];  
  47.             }  
  48.         }  
  49.         long long t=0;  
  50.         for(int i=nums[0]-1;i>=0;--i){  
  51.             int j=tmp[0][i];  
  52.             for(;j<nums[1];++j){  
  53.                 //这里可以优化,可以减少加法的次数  
  54.                 //通过利用上一次i循环的t的值  
  55.                 t+=tmp[1][j];  
  56.                 t%=div;  
  57.             }  
  58.         }  
  59.         return t;  
  60.     }  
  61. };  
  62. //start 提示:自动阅卷起始唯一标识,请勿删除或增加。  
  63. int main()  
  64. {     
  65.     cout<<Test::howmany("iinbinbing")<<endl;     
  66. }   
  67. //end //提示:自动阅卷结束唯一标识,请勿删除或增加。  
  1. public class Test   
  2. {   
  3.    public static int howmany(String s){  
  4.         int bNum = 0;  
  5.         int biNum = 0;  
  6.         int binNum = 0;  
  7.         int bingNum = 0;  
  8.         for(int i=0;i<s.length();i++){  
  9.             switch (s.charAt(i)) {  
  10.             case 'b':bNum++;break;  
  11.             case 'i':biNum=biNum%1000000007+bNum; break;  
  12.             case 'n':binNum = binNum%1000000007+biNum;    break;  
  13.             case 'g':bingNum = bingNum%1000000007+binNum; break;  
  14.             default:  
  15.                 break;  
  16.             }  
  17.         }  
  18.         return bingNum%1000000007;  
  19.     }  
  20.     //start 提示:自动阅卷起始唯一标识,请勿删除或增加。   
  21.     public static void main(String args[])   
  22.     {   
  23.        System.out.println(howmany("binbinggg"));  
  24.     }   
  25.     //end //提示:自动阅卷结束唯一标识,请勿删除或增加。  
  26. }          

目录
相关文章
|
存储 算法
攻克数据结构和算法——第四天:字典
字典有顺序存储,链式存储和散列表示三种存储方式,其中,链式存储又有跳跃链表和树形结构两种方式存储。
100 0
攻克数据结构和算法——第四天:字典
|
存储 前端开发 算法
【戏玩算法】07-字典
在前面的几篇文章中,我们学习了栈、队列、链表以及集合,在这篇文章中学习一个新的数据结构——字典。
90 0
【戏玩算法】07-字典
数据字典内的key按照字典排序,常见于加密算法中
数据字典内的key按照字典排序,常见于加密算法中
73 0
|
存储 算法 JavaScript
未完成--字典--《数据结构与算法》
未完成--字典--《数据结构与算法》
72 0
|
机器学习/深度学习 自然语言处理 算法
每日算法系列【LeetCode 386】字典序排数
给定一个整数 n, 返回从 1 到 n 的字典顺序。 例如,给定 n = 13,返回 [1,10,11,12,13,2,3,4,5,6,7,8,9] 。 请尽可能的优化算法的时间复杂度和空间复杂度。输入的数据 n 小于等于 5,000,000。
149 0
每日算法系列【LeetCode 386】字典序排数
|
算法 Java
贪心算法——最低字典序,从头到尾利用贪心算法求解
贪心算法——最低字典序,从头到尾利用贪心算法求解
贪心算法——最低字典序,从头到尾利用贪心算法求解
|
算法 Python
<LeetCode天梯>Day012 两数之和(暴力求解+枚举字典+哈希) | 初级算法 | Python
<LeetCode天梯>Day012 两数之和(暴力求解+枚举字典+哈希) | 初级算法 | Python
<LeetCode天梯>Day012 两数之和(暴力求解+枚举字典+哈希) | 初级算法 | Python
|
自然语言处理 算法 搜索推荐
[leetcode/lintcode 题解]算法面试真题详解:外星人字典
[leetcode/lintcode 题解]算法面试真题详解:外星人字典
[leetcode/lintcode 题解]算法面试真题详解:外星人字典

热门文章

最新文章