【unordered_map和unordered_set的封装】

简介: 【unordered_map和unordered_set的封装】

1 哈希表的基本改造

这里的思路与前面讲解map/set的封装思路一致,STL不喜欢直接实例化出两份几乎相同的代码,所以用了模板参数来处理,还是老规矩:set中传入的是<K,K>,map中传入的是<K,Pair<K,V>>.这样我们在哈希桶的结构中只需要用一个T类型的模板参数接受上层传入的参数即可。

基本框架的改造:

namespace BucketHash
{
  template<class T>
  struct BucketHashNode
  {
    BucketHashNode* _next;
    T _data;
    BucketHashNode(const T& data)
      :_next(nullptr)
      ,_data(data)
    {}
  };
  template<class K>
  struct HashTranfor
  {
    size_t operator()(const K& k)
    {
      return (size_t)k;
    }
  };
  //特化一个版本出来
  template<>
  struct HashTranfor<string>
  {
    // BKDR
    size_t operator()(const string& key)
    {
      size_t val = 0;
      for (auto ch : key)
      {
        val *= 131;
        val += ch;
      }
      return val;
    }
  };
  static const int __stl_num_primes = 28;
  static const unsigned long __stl_prime_list[__stl_num_primes] =
  {
    53,         97,         193,       389,       769,
    1543,       3079,       6151,      12289,     24593,
    49157,      98317,      196613,    393241,    786433,
    1572869,    3145739,    6291469,   12582917,  25165843,
    50331653,   100663319,  201326611, 402653189, 805306457,
    1610612741, 3221225473, 4294967291
  };
  template<class K, class T,class Hash,class KeyOfT>//给出第一个模板参数的目的是为了Insert
                          //时能够正确将K插入
  class HashTable
  {
  private:
    typedef BucketHashNode<T> Node;
    vector<Node*> _tables;
    size_t _size = 0;
  public:
    size_t GetCapacity(size_t sz)
    {
      int i = 0;
      for (; i < __stl_num_primes; ++i)
      {
        if (sz < __stl_prime_list[i]) break;
      }
      return __stl_prime_list[i];
    }
    ~HashTable()
    {
      for (size_t i = 0; i < _tables.size(); ++i)
      {
        Node* cur = _tables[i];
        while (cur)
        {
          Node* next = cur->_next;
          delete cur;
          cur = next;
        }
        _tables[i] = nullptr;
      }
    }
    size_t Size()const
    {
      return _tables.size();
    }
    size_t BucketSize()const
    {
      int cnt = 0;
      for (int i = 0; i < Size(); ++i)
      {
        if (_tables[i])
          ++cnt;
      }
      return cnt;
    }
    size_t MaxBucketSize()const
    {
      int maxLen = 0;
      for (int i = 0; i < Size(); ++i)
      {
        Node* cur = _tables[i];
        int len = 0;
        while (cur)
        {
          ++len;
          cur = cur->_next;
        }
        maxLen = max(maxLen, len);
      }
      return maxLen;
    }
  };

注意:

  • 为了得到set和map比较的参数所以我们设置一个模板参数KeyOfT来获取set/map比较大小的数据。

2 迭代器

封装中最重要的一环就是迭代器了,那么究竟该如何设计迭代器呢?

2.1 迭代器的大致框架

首先我们来想想:迭代器究竟该有哪些成员?

由于迭代器要支持++操作(这里的迭代器不支持- -操作,因为是单向迭代器(底层用的是单链表)),所以我们得拿到整张表来方便我们遍历,我们还需要结点指针来帮助我们取数据。

所以我们就能够搭建出迭代器的大致框架了:

  //前置声明
  template<class K, class T, class Hash, class KeyOfT>
  class HashTable;
  //迭代器
  template<class K, class T, class Ref, class Ptr, class Hash, class KeyOfT>
  struct __TableIterator
  {
    typedef BucketHashNode<T> Node;
    typedef HashTable<K, T, Hash, KeyOfT> HTable;
    typedef __TableIterator<K, T, Ref, Ptr, Hash, KeyOfT> Self;
    typedef __TableIterator<K, T, T&, T*, Hash, KeyOfT> Iterator;
    Node* _node;//结点指针,方便取数据
    HTable* _ht;//找到哈希表
    __TableIterator(Node* node,HTable* ht)
      :_node(node)
      ,_ht(ht)
    {}
    __TableIterator(const Iterator& it)
      :_node(it._node)
      ,_ht(it._ht)
    {}
    Ref operator*()
    {
      return _node->_data;
    }
    Ptr operator->()
    {
      return &_node->_data;
    }
    bool operator==(const Self& self)const
    {
      return self._node == _node;
    }
    bool operator!=(const Self& self)const
    {
      return self._node != _node;
    }
  };

注意:迭代器的成员变量由于用到了哈希桶结构,而哈希桶的实现在迭代器的下面,所以我们要在迭代器前面加上一个前置声明

现在的关键是如何实现出++运算符的重载。

2.2 ++运算符重载的实现

其实这个的实现也不难,我们已经拿到了哈希表,所以只需要从当前位置找到表中下一个位置即可:

    Self& operator++()
    {
      if (_node->_next)
        _node = _node->_next;
      else
      {
        Hash hash;
        KeyOfT kot;
        size_t hashi = hash(kot(_node->_data)) % _ht->Size();
        ++hashi;
        for (; hashi < _ht->Size(); ++hashi)
        {
          if (_ht->_tables[hashi])
          {
            _node = _ht->_tables[hashi];
            break;
          }
        }
        if (hashi == _ht->Size())
          _node = nullptr;
      }
      return *this;
    }

但是还有一个问题:我们哈希表的实现中成员变量是私有的,所以迭代器是不能够访问的,为了方便我们可以在哈希表结构中加上友元声明,当然大家自己也可以实现get接口取数据,方法有很多,大家可以自行选择。

class HashTable
  {
  private:
    template<class K, class T, class Ref, class Ptr, class Hash, class KeyOfT>
    friend struct __TableIterator;
    typedef BucketHashNode<T> Node
  };

2.3 哈希表的完善

  template<class K, class T,class Hash,class KeyOfT>//给出第一个模板参数的目的是为了Insert
                          //时能够正确将K插入
  class HashTable
  {
  private:
    template<class K, class T, class Ref, class Ptr, class Hash, class KeyOfT>
    friend struct __TableIterator;
    typedef BucketHashNode<T> Node;
    vector<Node*> _tables;
    size_t _size = 0;
  public:
    typedef __TableIterator<K, T, T&, T*, Hash, KeyOfT> iterator;
    typedef __TableIterator<K, T, const T&, const T*, Hash, KeyOfT> const_iterator;
    iterator begin()
    {
      for (size_t i = 0; i < _tables.size(); ++i)
      {
        if (_tables[i])
          return iterator(_tables[i], this);
      }
      return end();
    }
    iterator end()
    {
      return iterator(nullptr, this);
    }
    const_iterator begin()const
    {
      for (size_t i = 0; i < _tables.size(); ++i)
      {
        if (_tables[i])
          return const_iterator(_tables[i], this);
      }
      return end();
    }
    const_iterator end()const
    {
      return const_iterator(nullptr, this);
    }
    size_t GetCapacity(size_t sz)
    {
      int i = 0;
      for (; i < __stl_num_primes; ++i)
      {
        if (sz < __stl_prime_list[i]) break;
      }
      return __stl_prime_list[i];
    }
    ~HashTable()
    {
      for (size_t i = 0; i < _tables.size(); ++i)
      {
        Node* cur = _tables[i];
        while (cur)
        {
          Node* next = cur->_next;
          delete cur;
          cur = next;
        }
        _tables[i] = nullptr;
      }
    }
    pair<iterator,bool> Insert(const T& data)
    {
      KeyOfT kot;
      Hash hash;
      auto ret = Find(kot(data));
      if (ret != end())
        return make_pair(ret, false);
      //扩容,负载因子为1
      if (_size == _tables.size())
      {
        //int newcapacity = _tables.size() == 0 ? 10 : _tables.size() * 2;
        int newcapacity =GetCapacity(_tables.size());
        vector<Node*> newTables;//这里直接用vector的目的是可以直接用原表的结点直接链接即可
                    //不必多拷贝结点
        newTables.resize(newcapacity);
        for (int i = 0; i < _tables.size(); ++i)
        {
          Node* cur = _tables[i];
          //头插
          while (cur)
          {
            Node* next = cur->_next;
            size_t hashi = hash(kot(cur->_data)) % newTables.size();
            cur->_next = newTables[hashi];
            newTables[hashi] = cur;
            cur=next;
          }
          _tables[i] = nullptr;
        }
        _tables.swap(newTables);
      }
      size_t hashi = hash(kot(data)) % _tables.size();
      Node* newNode = new Node(data);//这里不要加kot
      newNode->_next = _tables[hashi];
      _tables[hashi] = newNode;
      ++_size;
      return make_pair(iterator(newNode,this), true);
    }
    iterator Find(const K& k)
    {
      if (_tables.size()==0)
        return end();
      KeyOfT kot;
      Hash hash;
      size_t hashi = hash(k) % _tables.size();
      Node* cur = _tables[hashi];
      while (cur)
      {
        if (kot(cur->_data) == k)
          return iterator(cur,this);
        cur = cur->_next;
      }
      return end();
    }
    bool Erase(const K& k)
    {
      if (Find(k) == nullptr)
        return false;
      KeyOfT kot;
      Hash hash;
      size_t hashi = hash(k) % _tables.size();
      if (kot(_tables[hashi]->_data) == k)
      {
        Node* del = _tables[hashi];
        _tables[hashi] = del->_next;
        delete del;
        --_size;
        return true;
      }
      Node* cur = _tables[hashi];
      while (cur->_next && kot(cur->_next->_data) != k)
      {
        cur = cur->_next;
      }
      Node* del = cur->_next;
      cur->_next = del->_next;
      delete del;
      --_size;
      return true;
    }
    size_t Size()const
    {
      return _tables.size();
    }
    size_t BucketSize()const
    {
      int cnt = 0;
      for (int i = 0; i < Size(); ++i)
      {
        if (_tables[i])
          ++cnt;
      }
      return cnt;
    }
    size_t MaxBucketSize()const
    {
      int maxLen = 0;
      for (int i = 0; i < Size(); ++i)
      {
        Node* cur = _tables[i];
        int len = 0;
        while (cur)
        {
          ++len;
          cur = cur->_next;
        }
        maxLen = max(maxLen, len);
      }
      return maxLen;
    }
  };

注意:由于迭代器的构造中我们需要哈希表的指针,而恰好this就是哈希表指针,所以我们传入this即可。另外find和inset时为了与STL保持一致,我们将返回值分别修改为iterator和pair<terator,bool>。

3 unordered_map和unordered_set的封装

这个思路与红黑树种map/set的封装思路一致,如何实现unordered_map支持修改val,不支持修改key;而unordered_set不支持修改key也是一致的:unordered_map的pair中的参数给<const K,V>,而unordered_set的普通迭代器是用const迭代器实现的,const迭代器也是用const迭代器实现的。

但是unordered_set中这样实现就会有一些问题:我们用了普通迭代器构造了const迭代器,这样肯定是会编译报错的,所以在迭代器的中我们还得增加一个构造:

    typedef __TableIterator<K, T, Ref, Ptr, Hash, KeyOfT> Self;
    typedef __TableIterator<K, T, T&, T*, Hash, KeyOfT> Iterator;
    Node* _node;//结点指针
    HTable* _ht;//找到哈希表
    __TableIterator(const Iterator& it)
      :_node(it._node)
      ,_ht(it._ht)
    {}

这样如果上层传入的是普通迭代器那么就是一个拷贝构造,传入的是const迭代器的话就是用了普通迭代器构造const迭代器。这点大家一定要注意。

3.1 unordered_map

  template<class K, class V, class Hash = BucketHash::HashTranfor<K>>
  class unordered_map
  {
    struct MapKeyOfT
    {
      const K& operator()(const pair<K,V>& kv)
      {
        return kv.first;
      }
    };
  private:
    BucketHash::HashTable<K, pair<const K,V>, Hash, MapKeyOfT> _tab;
  public:
    typedef typename BucketHash::HashTable<K, pair<const K,V>, Hash, MapKeyOfT>::iterator iterator;
    //这里要加上typename 的原因是告诉编译器这里是模板的声明而不是静态成员的声明
    iterator begin()
    {
      return _tab.begin();
    }
    iterator end()
    {
      return _tab.end();
    }
    pair<iterator, bool> insert(const pair<K,V>& kv)
    {
      return _tab.Insert(kv);
    }
    V& operator[](const K& k)
    {
      auto ret = _tab.Insert(make_pair(k, V()));
      return ret.first->second;
    }
  };

3.2 unordered_set

  template<class K, class Hash = BucketHash::HashTranfor<K>>
  class unordered_set
  {
    struct SetKeyOfT
    {
      const K& operator()(const K& key)
      {
        return key;
      }
    };
  private:
    BucketHash::HashTable<K, K, Hash, SetKeyOfT> _tab;
  public:
    typedef typename BucketHash::HashTable<K, K, Hash, SetKeyOfT>::const_iterator iterator;
    //这里要加上typename 的原因是告诉编译器这里是模板的声明而不是静态成员的声明
    typedef typename BucketHash::HashTable<K, K, Hash, SetKeyOfT>::const_iterator const_iterator;
    iterator begin()
    {
      return _tab.begin();
    }
    iterator end()
    {
      return _tab.end();
    }
    const_iterator begin()const
    {
      return _tab.begin();
    }
    const_iterator end()const
    {
      return _tab.end();
    }
    pair<iterator, bool> insert(const K& k)
    {
      return _tab.Insert(k);
    }
  };

好了,这样封装基本上大致框架也就完成了。

如果该文对你有帮助的话能不能一键三连支持博主呢?💘💘💘


目录
相关文章
|
8月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
474 2
|
11月前
|
存储 缓存 JavaScript
Set和Map有什么区别?
Set和Map有什么区别?
702 1
|
存储 JavaScript 前端开发
for...of循环在遍历Set和Map时的注意事项有哪些?
for...of循环在遍历Set和Map时的注意事项有哪些?
748 156
|
8月前
|
存储 算法 容器
set_map的实现+set/map加持秒杀高频算法题锻炼算法思维
`set`基于红黑树实现,支持有序存储、自动去重,增删查效率为O(logN)。通过仿函数可自定义排序规则,配合空间配置器灵活管理内存。不支持修改元素值,迭代器失效需注意。`multiset`允许重复元素。常用于去重、排序及查找场景。
|
存储 C++ 容器
unordered_set、unordered_multiset、unordered_map、unordered_multimap的介绍及使用
unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素。在unordered_set中,元素的值同时也是唯一地标识它的key。在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key,unordered_set将相同哈希值的键值放在相同的桶中。unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低。它的迭代器至少是前向迭代器。前向迭代器的特性。
703 0
|
编译器 C++ 容器
用一棵红黑树同时封装出map和set
再完成上面的代码后,我们的底层代码已经完成了,这时候已经是一个底层STL的红黑树了,已经已符合库里面的要求了,这时候我们是需要给他穿上对应的“衣服”,比如穿上set的“衣服”,那么这个穿上set的“衣服”,那么他就符合库里面set的要求了,同样map一样,这时候我们就需要实现set与map了。因此,上层容器map需要向底层红黑树提供一个仿函数,用于获取T当中的键值Key,这样一来,当底层红黑树当中需要比较两个结点的键值时,就可以通过这个仿函数来获取T当中的键值了。我们就可以使用仿函数了。
166 0
|
存储 编译器 容器
set、map、multiset、multimap的介绍及使用以及区别,注意事项
set是按照一定次序存储元素的容器,使用set的迭代器遍历set中的元素,可以得到有序序列。set当中存储元素的value都是唯一的,不可以重复,因此可以使用set进行去重。set默认是升序的,但是其内部默认不是按照大于比较,而是按照小于比较。set中的元素不能被修改,因为set在底层是用二叉搜索树来实现的,若是对二叉搜索树当中某个结点的值进行了修改,那么这棵树将不再是二叉搜索树。
425 0
|
编译器 C++ 容器
【c++丨STL】基于红黑树模拟实现set和map(附源码)
本文基于红黑树的实现,模拟了STL中的`set`和`map`容器。通过封装同一棵红黑树并进行适配修改,实现了两种容器的功能。主要步骤包括:1) 修改红黑树节点结构以支持不同数据类型;2) 使用仿函数适配键值比较逻辑;3) 实现双向迭代器支持遍历操作;4) 封装`insert`、`find`等接口,并为`map`实现`operator[]`。最终,通过测试代码验证了功能的正确性。此实现减少了代码冗余,展示了模板与仿函数的强大灵活性。
388 2
|
编译器 容器
哈希表模拟封装unordered_map和unordered_set
哈希表模拟封装unordered_map和unordered_set