本文是针对[数据结构基础系列(8):查找]中第11课时[哈希表——散列结构]和第12课时[哈希表的运算]的实践项目。
【项目 - 用哈希法组织关键字】
已知一个关键字序列为if、while、for、case、do、break、else、struct、union、int、double、float、char、long、bool,共15个字符串,哈希函数H(key)为关键字的第一个字母在字母表中的序号,哈希表的表长为26。
(1)若处理冲突的方法采用线性探测法,请设计算法,输出每个关键字对应的H(key),输出哈希表,并求成功情况下的平均查找长度。
[参考解答]
#include <stdio.h>
#include <string.h>
#define N 15
#define M 26
int H(char *s)
{
return ((*s-'a'+1)%M);
}
int main()
{
char *s[N]= {"if", "while", "for", "case", "do", "break", "else", "struct", "union", "int", "double", "float", "char", "long", "bool"};
int i, j, k;
char HT[M][10];
int Det[M]; //存放探测次数
for(i=0; i<M; i++)
{
HT[i][0]='\0';
Det[i]=0;
}
printf("字符串 key\tH(key)\n");
printf("------------------------\n");
for(i=0; i<N; i++)
{
j=H(s[i]); //求哈希值
printf("%s\t\t%d\n", s[i],j);
k=0; //探测次数初值
while(1)
{
k++; //累加探测次数
if(HT[j][0]=='\0') //当不冲突时,直接放到该处
{
strcpy(HT[j], s[i]);
break;
}
else //冲突时,采用线性探查法求下一个地址
{
j=(j+1)%M;
}
}
Det[j]=k;
}
printf("---------------------\n");
printf("哈希表\n");
printf("位置\t字符串\t探查次数\n");
printf("---------------------\n");
for(i=0; i<M; i++)
printf("%d\t%s\t%d\n", i, HT[i], Det[i]);
printf("---------------------\n");
k=0;
for(i=0; i<M; i++)
k+=Det[i];
printf("查找成功情况下的平均查找长度 %f\n", 1.0*k/N);
return 0;
}
(2)若处理冲突的方法采用链地址法,请设计算法,输出哈希表,并计算成功情况和不成功情况下的平均查找长度。
[参考解答]
#include <stdio.h>
#include <string.h>
#include <malloc.h>
#define N 15
#define M 26
typedef struct node //定义哈希链表的节点类型
{
char *key;
struct node *next;
} LNode;
typedef struct
{
LNode *link;
} HTType;
int H(char *s) //实现哈希函数
{
return ((*s-'a'+1)%M);
}
//构造哈希表
void Hash(char *s[], HTType HT[])
{
int i, j;
LNode *q;
for(i=0; i<M; i++) //哈希表置初值
HT[i].link=NULL;
for(i=0; i<N; i++) //存储每一个关键字
{
q=(LNode*)malloc(sizeof(LNode)); //创建新节点
q->key = (char*)malloc(sizeof(strlen(s[i])+1));
strcpy(q->key, s[i]);
q->next=NULL;
j=H(s[i]); //求哈希值
if(HT[j].link==NULL) //不冲突,直接加入
HT[j].link=q;
else //冲突时,采用前插法插入
{
q->next = HT[j].link;
HT[j].link=q;
}
}
}
//输出哈希表
void DispHT(HTType HT[])
{
int i;
LNode *p;
printf("哈希表\n");
printf("位置\t关键字序列\n");
printf("---------------------\n");
for(i=0; i<M; i++)
{
printf(" %d\t", i);
p=HT[i].link;
while(p!=NULL)
{
printf("%s ", p->key);
p=p->next;
}
printf("\n");
}
printf("---------------------\n");
}
//求查找成功情况下的平均查找长度
double SearchLength1(char *s[], HTType HT[])
{
int i, k, count = 0;
LNode *p;
for(i=0; i<N; i++)
{
k=0;
p=HT[H(s[i])].link;
while(p!=NULL)
{
k++; //p!=NULL,进入循环就要做一次查找
if(strcmp(p->key, s[i])==0) //若找到,则退出
break;
p=p->next;
}
count+=k;
}
return 1.0*count/N; //成功情况仅有N种
}
//求查找不成功情况下的平均查找长度
double SearchLength2(HTType HT[])
{
int i, k, count = 0; //count为各种情况下不成功的总次数
LNode *p;
for(i=0; i<M; i++)
{
k=0;
p=HT[i].link;
while(p!=NULL)
{
k++;
p=p->next;
}
count+=k;
}
return 1.0*count/M; //不成功时,在表长为M的每个位置上均可能发生
}
int main()
{
HTType HT[M];
char *s[N]= {"if", "while", "for", "case", "do", "break", "else", "struct", "union", "int", "double", "float", "char", "long", "bool"};
Hash(s, HT);
DispHT(HT);
printf("查找成功情况下的平均查找长度 %f\n", SearchLength1(s, HT));
printf("查找不成功情况下的平均查找长度 %f\n", SearchLength2(HT));
return 0;
}