上机实验四 哈希表设计 西安石油大学数据结构

简介: 上机实验四 哈希表设计 西安石油大学数据结构

实验名称:哈希表设计

(1)实验目的:掌握哈希表的设计方法及其冲突解决方法。

(2)主要内容:

已知一个含有10个学生信息的数据表,关键字为学生“姓名”的拼音,给出此表的一个哈希表设计方案。

要求:

1)建立哈希表:要求哈希函数采用除留余数法,解决冲突方法采用链表法。

2)编写一个测试主函数:输入10个学生的姓名拼音(即10个字符串)存入数组,然后对该姓名数组初始化(即将各字符串中字符的ASCII码相加,形成每个姓名的关键字),最后输出哈希表中各数据元素。

提示:最好不要输入重名

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define SIZE 10
// 学生信息结构体
typedef struct {
    char name[20];
} Student;
// 哈希表节点结构体
typedef struct Node {
    Student student;
    struct Node* next;
} Node;
// 哈希表结构体
typedef struct {
    Node* buckets[SIZE];
} HashTable;
// 初始化哈希表
void initHashTable(HashTable* hashTable) {
    for (int i = 0; i < SIZE; i++) {
        hashTable->buckets[i] = NULL;
    }
}
// 计算哈希值
int hash(char* name) {
    int sum = 0;
    for (int i = 0; i < strlen(name); i++) {
        sum += name[i];
    }
    return sum % SIZE;
}
// 向哈希表中插入节点
void insertNode(HashTable* hashTable, Student student) {
    int index = hash(student.name);
    Node* newNode = (Node*)malloc(sizeof(Node));
    newNode->student = student;
    newNode->next = NULL;
    if (hashTable->buckets[index] == NULL) {
        hashTable->buckets[index] = newNode;
    } else {
        Node* current = hashTable->buckets[index];
        while (current->next != NULL) {
            current = current->next;
        }
        current->next = newNode;
    }
}
// 打印哈希表中的数据元素
void printHashTable(HashTable* hashTable) {
    for (int i = 0; i < SIZE; i++) {
        printf("Bucket %d: ", i);
        Node* current = hashTable->buckets[i];
        while (current != NULL) {
            printf("%s ", current->student.name);
            current = current->next;
        }
        printf("\n");
    }
}
int main() {
    HashTable hashTable;
    initHashTable(&hashTable);
    Student students[10];
    printf("请输入10个学生的姓名拼音:\n");
    for (int i = 0; i < 10; i++) {
        scanf("%s", students[i].name);
        insertNode(&hashTable, students[i]);
    }
    printf("哈希表中各数据元素如下:\n");
    printHashTable(&hashTable);
    return 0;
}

这是一个使用哈希表实现的学生信息管理系统,可以插入学生姓名并打印出哈希表中的数据元素。哈希表使用链表解决哈希冲突。具体来说,程序分为以下几个部分:

  1. 定义结构体

程序首先定义了两个结构体,分别用于存储学生信息和哈希表节点信息。

  1. 初始化哈希表

程序定义了一个初始化哈希表的函数,将哈希表中每个桶初始化为空。

  1. 计算哈希值

程序定义了一个计算哈希值的函数,该函数将输入的字符串转换为一个整数作为哈希值。计算方法为将字符串中各字符的ASCII码相加,然后取余。

  1. 插入节点

程序定义了一个向哈希表中插入节点的函数,该函数首先计算出输入学生姓名的哈希值,然后将学生信息存储在哈希表中对应的桶中。如果该桶已经有了数据,则使用链表将新节点插入到链表尾部。

  1. 打印哈希表中的数据元素

程序定义了一个打印哈希表中的数据元素的函数,该函数遍历整个哈希表,逐个打印出每个桶中的节点信息。

  1. 主函数

主函数中调用上述函数,先让用户输入10个学生的姓名拼音,然后将学生信息插入哈希表中,并最终打印出哈希表中的数据元素。

需要注意的是,哈希函数的设计要尽可能地均匀,以避免大量数据集中在某个桶中,影响查询效率。此外,在插入和查询时,需要注意处理哈希冲突的情况。

问题描述

建立哈希表:

哈希函数采用除留余数法:即将关键字除以表长取余数,得到的余数作为该关键字的存储位置。

解决冲突方法采用链表法:当发生哈希冲突时,将具有相同余数的关键字存储在同一位置的链表中。

测试主函数:

输入10个学生的拼音姓名,存入数组。

对姓名数组初始化:计算每个姓名的关键字,即将各字符串中字符的ASCII码相加。

输出哈希表中各数据元素。

建立哈希表

确定哈希表的大小(表长),一般选择一个素数作为表长,这里假设选择表长为13。

创建一个包含13个链表的数组,用于存储哈希表的数据元素。

编写测试主函数

创建一个结构体用于表示学生信息,包括姓名和关键字。

编写哈希函数,以及插入元素和输出哈希表的函数。

在主函数中,创建存储学生信息的数组,计算每个姓名的关键字,并根据哈希函数的结果将其插入哈希表中。

最后输出哈希表中各数据元素。

要求:

建立哈希表:采用除留余数法作为哈希函数,解决冲突方法采用链表法。

编写一个测试主函数:输入10个学生的姓名拼音(即10个字符串)存入数组,然后对该姓名数组初始化(即将各字符串中字符的ASCII码相加,形成每个姓名的关键字),最后输出哈希表中各数据元素。

具体步骤:

定义哈希表的大小为10,即有10个槽位用于存放数据,每个槽位可以是一个链表。

哈希函数采用除留余数法,将学生姓名的拼音转换成一个整数作为关键字。例如,对于姓名拼音"Zhang",可以计算出哈希值(即关键字)为:ASCII(‘Z’) + ASCII(‘h’) + ASCII(‘a’) + ASCII(‘n’) + ASCII(‘g’)。

初始化一个字符串数组,大小为10,用于存储学生的姓名拼音。

输入10个学生的姓名拼音,将其存入数组中。

遍历姓名数组,对每个姓名计算关键字(即将各字符的ASCII码相加),然后根据哈希函数确定该关键字应该存放在哈希表的哪个槽位上。

如果该槽位为空,则将该关键字插入槽位;如果该槽位已经有其他关键字,采用链表法将该关键字插入链表的尾部。

最后输出哈希表中各数据元素,即遍历哈希表的每个槽位,输出槽位中的关键字。

测试数据

["Zhang", "Wang", "Li", "Zhao", "Liu", "Chen", "Yang", "Huang", "Zhou", "Wu"]

根据这些数据,我们可以计算出每个姓名的关键字(即将各字符的ASCII码相加),然后根据哈希函数确定该关键字应该存放在哈希表的哪个槽位上。

算法思想

该程序使用了哈希表来解决学生信息管理的问题。哈希表是一种以键-值对形式存储数据的数据结构,它通过将键映射到数组中的索引位置来实现高效的数据访问。

算法思想如下:

  1. 初始化哈希表,创建一个具有固定大小的数组,并将每个位置初始化为空。
  2. 对于每个要插入的学生信息,计算其哈希值(可以使用散列函数),将其映射到哈希表中的一个索引位置。
  3. 如果该索引位置为空,则将学生信息插入到该位置;如果不为空,则发生冲突,需要进行解决冲突的操作。
  4. 解决冲突的方法可以是开放寻址法或链地址法。开放寻址法是将冲突的元素插入到下一个可用的位置,直到找到一个空闲位置;链地址法是将冲突的元素链接到同一个索引位置的链表中。
  5. 插入完成后,可以通过键值查找相应的学生信息。计算键的哈希值,找到对应的索引位置,然后在该位置的链表上查找。
  6. 可以根据具体需求,实现删除、更新等其他操作。

通过使用哈希表,可以快速插入、查找和删除学生信息,时间复杂度接近常数级别,提高了数据的访问效率。这是哈希表算法的主要思想。

模块划分

在这个程序中,可以将函数划分为以下几个模块:

  1. 哈希表模块
  • initHashTable(HashTable* hashTable):初始化哈希表
  • hash(char* name):计算哈希值
  • insertNode(HashTable* hashTable, Student student):向哈希表中插入节点
  • printHashTable(HashTable* hashTable):打印哈希表中的数据元素
  1. 学生信息模块
  • 结构体定义:定义了学生信息结构体(Student)
  1. 主函数模块
  • main():主函数,用于调用其他函数实现学生信息的输入、插入和打印哈希表等功能

可以将这些函数分别放置在不同的文件中进行组织,例如:

  • hash_table.c:包含哈希表模块相关的函数实现
  • student.c:包含学生信息模块相关的结构体定义
  • main.c:包含主函数和与用户交互的部分

这样的文件组织结构可以提高代码的可读性和可维护性。同时,需要在对应的头文件中声明这些函数和结构体,以便在其他文件中引用和调用。例如:

  • hash_table.h:声明哈希表模块相关的函数
  • student.h:声明学生信息模块相关的结构体
  • main.h:声明主函数模块相关的函数

通过合理的模块划分和文件组织,可以使程序的结构更加清晰,易于理解和维护。

数据结构

(描述存储数据元素的存储结构)

在该程序中,使用了以下数据结构来存储学生信息:

  1. 学生信息结构体Student:用于表示每个学生的信息,包含一个名为name的字符数组成员。
struct Student {
    char name[50];
};
  1. 哈希表结构体HashTable:用于表示哈希表,包含一个固定大小的数组table,用于存储学生信息。数组的每个元素可以是一个链表的头节点,用于处理冲突。
struct HashTable {
    struct Student* table[MAX_SIZE];
};

在哈希表中,通过散列函数将学生信息的键(例如学生姓名)映射到数组中的一个索引位置。如果发生冲突,即多个学生信息映射到了同一个索引位置,可以使用链地址法,将冲突的学生信息链接到同一个索引位置的链表中。

因此,哈希表的每个数组元素table[i](0 <= i < MAX_SIZE)可以是一个指向学生信息结构体的指针,或者是一个链表的头节点。

struct Student {
    char name[50];
};
struct HashTable {
    struct Student* table[MAX_SIZE];
};

其中,Student结构体表示学生信息,HashTable结构体表示哈希表。

结果

我输入了以下学生的姓名拼音:

  1. Zhangsan
  2. Lisi
  3. Wangwu
  4. Zhaoliu
  5. Qianqi
  6. Sunba
  7. Zhoujiu
  8. Fengshi
  9. Wangwu
  10. Chenyi

根据这些输入,哈希表中的数据元素如下所示:

Bucket 0: 
Bucket 1: Fengshi 
Bucket 2: Qianqi 
Bucket 3: Sunba 
Bucket 4: 
Bucket 5: 
Bucket 6: Wangwu Wangwu 
Bucket 7: Zhangsan 
Bucket 8: Lisi 
Bucket 9: Zhaoliu Zhoujiu Chenyi

这是根据输入模拟的哈希表中的数据分布。每个桶对应一个哈希值,然后在每个桶中列出了对应的学生姓名。需要注意的是,由于"王五"重复出现,因此在桶6中出现了两次。

根据你提供的代码,我注意到了一些问题并给出以下建议:

  1. 哈希函数的选择:当前的哈希函数只是将姓名中每个字符的ASCII码求和并取余数。这种简单的哈希函数可能会导致较高的冲突率,使得哈希表的性能下降。建议考虑使用更复杂的哈希函数,例如乘法哈希或者除法哈希,以减少冲突。
  2. 内存泄漏:在插入节点时,为新节点分配了内存空间,但是在程序结束后没有释放这些节点的内存空间,这会导致内存泄漏。建议在程序结束前,遍历哈希表并释放所有节点的内存空间。
  3. 哈希表大小的选择:当前的哈希表大小是固定的,通过宏定义为10。然而,实际应用中,哈希表的大小应该根据预计的数据量进行动态调整,以避免过多的冲突或者浪费内存空间。
  4. 输入安全性:在接受用户输入时,代码没有对输入进行严格的验证和处理,存在缓冲区溢出的风险。建议使用安全的输入函数,如fgets()来获取用户输入,并对输入进行适当的验证和处理。
  5. 错误处理:代码没有对插入节点时的内存分配失败进行错误处理。在实际应用中,应该检查内存分配函数(如malloc())的返回值,以确保分配成功,并在分配失败时采取适当的错误处理措施。
目录
相关文章
|
1月前
|
存储 算法 编译器
数据结构实验之矩阵的运算器(二维数组)
本实验旨在通过团队合作,掌握数组和矩阵相关运算的代码实现,包括矩阵的加减、数乘、转置、乘法、n次方及行列式的计算。实验过程中,成员们需分工协作,解决编程难题,最终实现一个功能完备的矩阵计算器。通过本实验,不仅锻炼了编程能力,还加深了对数学概念的理解,同时培养了团队合作精神。
57 4
|
1月前
数据结构实验之串模式匹配问题
本实验旨在掌握串模式匹配技术,通过创建文本文件、实现单词计数与定位功能,最终构建一个包含文件建立、单词统计与定位、程序退出等选项的主菜单,以增强对字符串处理的理解与应用能力。
45 4
|
1月前
|
算法
数据结构实验之最长公共子序列
本实验旨在通过编程实践帮助学生理解串的基本概念及求解最长公共子序列的算法。实验内容包括使用动态规划方法设计并实现算法,以找出给定两序列的最大公共子序列。示例代码展示了如何通过构建状态矩阵和回溯路径来找到解决方案。实验总结指出,`memset()`函数用于内存初始化,且对于特定输入,程序能正确输出最长公共子序列之一。
52 4
|
1月前
|
算法
数据结构实验之操作系统打印机管理器问题
本实验旨在通过实现操作系统中的打印机管理器问题,掌握队列的基本操作如入队、出队等,利用队列的先进先出特性解决先申请先打印的问题。实验包括队列的初始化、入队、出队、打印队列内容等功能,并通过菜单式界面进行交互。实验结果显示基本功能可正常执行,但在连续操作时存在执行失败的情况,需进一步优化。
42 4
|
1月前
|
存储 算法 Perl
数据结构实验之链表
本实验旨在掌握线性表中元素的前驱、后续概念及链表的建立、插入、删除等算法,并分析时间复杂度,理解链表特点。实验内容包括循环链表应用(约瑟夫回环问题)、删除单链表中重复节点及双向循环链表的设计与实现。通过编程实践,加深对链表数据结构的理解和应用能力。
54 4
|
1月前
|
机器学习/深度学习 存储 算法
数据结构实验之二叉树实验基础
本实验旨在掌握二叉树的基本特性和遍历算法,包括先序、中序、后序的递归与非递归遍历方法。通过编程实践,加深对二叉树结构的理解,学习如何计算二叉树的深度、叶子节点数等属性。实验内容涉及创建二叉树、实现各种遍历算法及求解特定节点数量。
81 4
|
1月前
|
存储 人工智能 算法
数据结构实验之C 语言的函数数组指针结构体知识
本实验旨在复习C语言中的函数、数组、指针、结构体与共用体等核心概念,并通过具体编程任务加深理解。任务包括输出100以内所有素数、逆序排列一维数组、查找二维数组中的鞍点、利用指针输出二维数组元素,以及使用结构体和共用体处理教师与学生信息。每个任务不仅强化了基本语法的应用,还涉及到了算法逻辑的设计与优化。实验结果显示,学生能够有效掌握并运用这些知识完成指定任务。
51 4
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
186 9
|
1月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
32 1
|
23天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
44 5