【C++】-- STL之用哈希桶模拟实现unordered_set和unordered_map(一)

简介: 【C++】-- STL之用哈希桶模拟实现unordered_set和unordered_map

一、哈希桶节点的修改

       用哈希桶封装实现unordered_set和unordered_map,就要考虑到他们传给哈系统的数据元素不同,unordered_set传给哈希桶的是k,unordered_map传给哈希桶的是pair,那么哈希桶面对这两种不同的数据,如何做到统一处理呢?

        面对unordered_set传给哈希桶的是k,unordered_map传给哈希桶的是pair,就把K和V统一封装成T,用T代替pair<K,V>:

1.  template<class T>
2.  struct HashNode
3.  {
4.    HashNode<T>* _next;
5.    T _data;
6. 
7.    HashNode(const T& data)
8.      :_data(data)
9.      , _next(nullptr)
10.     {}
11.   };

二、哈希表

类模板需要修改,模板里面必须包含K,因为要用K来计算数据映射的位置。由于哈希桶的节点类型换成了T ,用T来替代V。KeyOfT仿函数确定上传的是unordered_set还是unordered_map。

1. template<class K, class T, class KeyOfT, class HashFunc = Hash<K>>
2.  class HashTable
3.  {
4.    typedef HashNode<T> Node;
5. 
6. //哈希桶迭代器
7.    template<class K,class T,class KeyOfT,class HashFunc>
8.    friend struct __HTIterator;
9.  public:
10.     typedef __HTIterator<K, T, KeyOfT, HashFunc> iterator;
11. 
12. private:
13.     vector<Node*> _table;
14.     size_t _n = 0;
15.   };

1.构造

使用默认构造函数就可以了,vector自定义类型会调用自己的默认构造函数,size_t作为内置类型编译器不处理:

HashTable() = default; // 显示指定生成默认构造

2.拷贝构造

_n 直接赋值就可以了。_table的拷贝就需要遍历ht的_table了,并且把ht的_table的每个结点都头插到_table表中:

1. //拷贝构造
2.    HashTable(const HashTable& ht)
3.    {
4.      _n = ht._n;//存储有效数据的个数一致
5.      _table.resize(ht._table.size());//开同样大小的空间
6. 
7.      //遍历ht,将ht的_table的每个结点都拷贝到_table中
8.      for (size_t i = 0; i < ht._table.size(); i++)
9.      {
10.         Node* cur = ht._table[i];
11.         while (cur)
12.         {
13.           Node* copy = new Node(cur->_data);
14. 
15.           //头插到新表
16.           copy->_next = _table[i];//copy的下一个桶为_table[i]
17.           _table[i] = copy;//把copy作为当前位置的第一个桶
18.           cur = cur->_next;//cur往下移         
19.         }
20.       }
21. 
22.     }

3.赋值运算符重载

只需要交换_table和_n即可:

1.    //赋值运算符重载
2.    HashTable& operator=(HashTable ht)
3.    {
4.      _table.swap(ht._table);
5.      swap(_n, ht._n);
6. 
7.      return *this;
8.    }

4.析构

只需要将_table 的每个结点删除后置空就可以了:

1.    //析构
2.    ~HashTable()
3.    {
4.      for (size_t i = 0; i < _table.size(); i++)
5.      {
6.        Node* cur = _table[i];
7.        while (cur)
8.        {
9.          Node* next = cur->_next;
10.           delete cur;
11.           cur = next;
12.         }
13.         _table[i] = nullptr;
14.       }
15.     }

5.迭代器

迭代器的参数包含节点位置和哈希表地址,在下一节迭代器中会讲,为什么都要使用指针:

1.    //迭代器开始
2. iterator begin()
3.    {
4.      size_t i = 0;
5.      while (i < _table.size())
6.      {
7.        if (_table[i])
8.        {
9.          return iterator(_table[i], this);
10.         }
11.         ++i;
12.       }
13. 
14.       return end();
15.     }
16. 
17. //迭代器结束
18.     iterator end()
19.     {
20.       return iterator(nullptr, this);
21.     }

6.查找

这时候就要用到仿函数KeyOfT了,仿函数KeyOfT的对象kot对于unordered_set会取k,对于unordered_map会取作为pair的kv的first作为k和key进行比较:

1.    //查找
2.    iterator Find(const K& key)
3.    {
4.      //哈希表为空
5.      if (_table.size() == 0)
6.      {
7.        return end();
8.      }
9. 
10.       KeyOfT kot;
11.       HashFunc hf;
12.       size_t index = hf(key) % _table.size();//计算在哈希表中的位置
13. 
14.       //在哈希表当前位置的所有桶中找key
15.       Node* cur = _table[index];
16.       while (cur)
17.       {
18.         if (kot(cur->_data) == key)
19.         {
20.           return iterator(cur,this);
21.         }
22.         else
23.         {
24.           cur = cur->_next;
25.         }
26.       }
27. 
28.       return end();
29.     }

7.插入

①需要先判断data在不在哈希桶中,在就直接返回查找到的位置

②如果不在,需要判断哈希桶需不需要增容,如果不需要增容就计算映射位置头插到哈希表中

③需要增容就要取旧表中的节点一一头插到新表中,并交换旧表和新表

1.    //插入
2.    pair<iterator,bool> Insert(const T& data)
3.    {
4.      KeyOfT kot;
5.      auto ret = Find(kot(data));
6.      if (ret != end())
7.      {
8.        return make_pair(ret,false);
9.      }
10. 
11.       //仿函数
12.       HashFunc hf;
13. 
14.       //负载因子为1时,进行增容
15.       if (_n == _table.size())
16.       {
17.         vector<Node*> newTable;
18.         newTable.resize(GetNextPrime(_table.size()));
19. 
20.         //取旧表中的结点,重新计算映射到新表中的位置,挂到新表中
21.         for (size_t i = 0; i < _table.size(); i++)
22.         {
23.           if (_table[i])
24.           {
25.             Node* cur = _table[i];
26.             while (cur)
27.             {
28.               Node* next = cur->_next;//保存下一个结点
29.               size_t index = hf(kot(cur->_data)) % newTable.size();//计算结映射到新表中的位置
30. 
31.               //头插
32.               cur->_next = newTable[index];//=nullptr,将cur->_next置空
33.               newTable[index] = cur;//将结点插入到新表
34.               cur = next;//哈希桶往下挪一个
35.             }
36.             _table[i] = nullptr;//当前哈希桶的第一个位置置空
37.           }
38.         }
39.         _table.swap(newTable);
40.       }
41. 
42.       //不需要增容时,头插
43.       size_t index = hf(kot(data)) % _table.size();
44.       Node* newNode = new Node(data);
45. 
46.       newNode->_next = _table[index];//让新节点newNode的next指向第一个桶
47.       _table[index] = newNode;//让新节点newNode做第一个桶
48.       ++_n;//更新哈希表大小  
49. 
50.       return make_pair(iterator(newNode, this), true);
51.     }

8.删除

①删除节点之前要先保留该节点的前一个 节点,否则删除改节点后,让前一个节点要指向下一个,但是又找不到前一个节点了。

②当找到key的映射位置后,要判断找到的节点是不是当前位置的第一个桶,如果是,就让当前位置指向下一个节点;如果不是就直接让前一个节点指向后一个节点。

1.    //删除
2.    bool Erase(const K& key)
3.    {
4.      size_t index = hf(key) % _table.size();
5.      Node* prev = nullptr;
6.      Node* cur = _table[index];
7. 
8.      while (cur)
9.      {
10.         if (kot(cur->data) == key)//cur这个桶就是key
11.         {
12.           if (_table[index] == cur)//cur是第一个桶
13.           {
14.             _table[index] = cur->_next;
15.           }
16.           else//cur不是第一个桶
17.           {
18.             prev->_next = cur->_next;
19.           }
20. 
21.           --_n;//更新表大小
22.           delete cur;//删除节点
23.           return true;
24.         }
25. 
26.         prev = cur;
27.         cur = cur->_next;
28.       }
29. 
30.       return false;
31.     }


相关文章
|
9天前
|
编译器 C语言 C++
【c++丨STL】list模拟实现(附源码)
本文介绍了如何模拟实现C++中的`list`容器。`list`底层采用双向带头循环链表结构,相较于`vector`和`string`更为复杂。文章首先回顾了`list`的基本结构和常用接口,然后详细讲解了节点、迭代器及容器的实现过程。 最终,通过这些步骤,我们成功模拟实现了`list`容器的功能。文章最后提供了完整的代码实现,并简要总结了实现过程中的关键点。 如果你对双向链表或`list`的底层实现感兴趣,建议先掌握相关基础知识后再阅读本文,以便更好地理解内容。
15 1
|
22天前
|
算法 C语言 C++
【c++丨STL】list的使用
本文介绍了STL容器`list`的使用方法及其主要功能。`list`是一种双向链表结构,适用于频繁的插入和删除操作。文章详细讲解了`list`的构造函数、析构函数、赋值重载、迭代器、容量接口、元素访问接口、增删查改操作以及一些特有的操作接口如`splice`、`remove_if`、`unique`、`merge`、`sort`和`reverse`。通过示例代码,读者可以更好地理解如何使用这些接口。最后,作者总结了`list`的特点和适用场景,并预告了后续关于`list`模拟实现的文章。
42 7
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
72 4
|
2月前
|
C语言 C++ 容器
【c++丨STL】string模拟实现(附源码)
本文详细介绍了如何模拟实现C++ STL中的`string`类,包括其构造函数、拷贝构造、赋值重载、析构函数等基本功能,以及字符串的插入、删除、查找、比较等操作。文章还展示了如何实现输入输出流操作符,使自定义的`string`类能够方便地与`cin`和`cout`配合使用。通过这些实现,读者不仅能加深对`string`类的理解,还能提升对C++编程技巧的掌握。
85 5
|
2月前
|
存储 算法 C++
【C++】unordered_map(set)
C++中的`unordered`容器(如`std::unordered_set`、`std::unordered_map`)基于哈希表实现,提供高效的查找、插入和删除操作。哈希表通过哈希函数将元素映射到特定的“桶”中,每个桶可存储一个或多个元素,以处理哈希冲突。主要组成部分包括哈希表、哈希函数、冲突处理机制、负载因子和再散列,以及迭代器。哈希函数用于计算元素的哈希值,冲突通过开链法解决,负载因子控制哈希表的扩展。迭代器支持遍历容器中的元素。`unordered_map`和`unordered_set`的插入、查找和删除操作在理想情况下时间复杂度为O(1),但在冲突较多时可能退化为O(n)。
28 5
|
2月前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
65 2
|
25天前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
32 0
|
2月前
|
存储 编译器 C++
【c++】类和对象(下)(取地址运算符重载、深究构造函数、类型转换、static修饰成员、友元、内部类、匿名对象)
本文介绍了C++中类和对象的高级特性,包括取地址运算符重载、构造函数的初始化列表、类型转换、static修饰成员、友元、内部类及匿名对象等内容。文章详细解释了每个概念的使用方法和注意事项,帮助读者深入了解C++面向对象编程的核心机制。
118 5
|
2月前
|
存储 编译器 C++
【c++】类和对象(中)(构造函数、析构函数、拷贝构造、赋值重载)
本文深入探讨了C++类的默认成员函数,包括构造函数、析构函数、拷贝构造函数和赋值重载。构造函数用于对象的初始化,析构函数用于对象销毁时的资源清理,拷贝构造函数用于对象的拷贝,赋值重载用于已存在对象的赋值。文章详细介绍了每个函数的特点、使用方法及注意事项,并提供了代码示例。这些默认成员函数确保了资源的正确管理和对象状态的维护。
120 4
|
2月前
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
160 4