最近看了一个关于hash的问题,不是很明白,于是乎就找了些关于这方面的题目,这道题是一道简单的hash 字符串题目,就先从他入手吧。
题目说字串的最大数量不超过16Millions,也就是字串的存储16000000就够了。
查看网上给出的hash映射是把字串映射成为一个NC进制的数字每个字串都是一个数字。
#include <stdio.h> #include <iostream> using namespace std; const int MAX = 16000005; const int NUM = 260; bool ha[MAX];//存储hash映射 char str[MAX];//存储元字符串 int num[NUM];//存储映射的数字 int main (void) { int n,nc,sum,count=0,ans=0; memset(num,0,sizeof(num)); memset(str,'\0',sizeof(str)); memset(ha,false,sizeof(ha)); scanf("%d%d",&n,&nc); scanf("%s",str); //将每一个字母映射到一个数字上,nc进制的数字 for (int i = 0; str[i] != '\0'; i++) { if(num[str[i]]==0) num[str[i]]=++count; if(count == nc)break; } //将每个字串计算一个结果数字,然后判断其hash 是否已经映射过次数字 //如果没映射过则ans加1这样就能找到有多少不重复的字串了。 int len = strlen(str); for(int i = 0; i <= len-n; i++) { sum = 0; for (int j = 0; j < n; j++) sum = sum*nc+num[str[i+j]]; if(!ha[sum]) { ha[sum]=true; ++ans; } } printf("%d\n",ans); return 0; }
本文转自NewPanderKing51CTO博客,原文链接: http://www.cnblogs.com/newpanderking/p/3777837.html,如需转载请自行联系原作者