【C++】-- 哈希算法(二)

简介: 【C++】-- 哈希算法

三、用开散列解决哈希冲突

1.开散列介绍

开散列也叫拉链法,先对所有key用散列函数计算散列地址,把有相同地址的key每个key都作为一个桶,通过单链表链接在哈希表中。

因此,开散列的每个桶中存放的都是哈希冲突的元素,负载因子较低。当桶超过一定长度时,就把冲突最多的桶就换成红黑树。实际中哈希桶的结构更实用,因为哈希桶空间利用率高,并且在极端情况下还有解决方案。

2.哈希桶的实现

哈希桶作为指针数组,数组的每个元素是一个结点的指针,链表不需要带哨兵位,且头插的效率比较高。

(1)哈希仿函数

在闭散列中,已经实现了Hash仿函数,用来获取哈希表中的元素的key,方便后续计算映射位置

1. #pragma once
2. #include <vector>
3. #include <iostream>
4. using namespace std;
5. namespace OpenHash
6. {
7.  template<class K>
8.  struct Hash
9.  {
10.     size_t operator()(const K& key)
11.     {
12.       return key;
13.     }
14.   };
15. }

模板特化:string元素使用频率较高,进行模板特化

1.  // 特化
2.  template<>
3.  struct Hash < string >
4.  {
5. //采用BKDR哈希进行计算
6.    size_t operator()(const string& s)
7.    {
8.      // BKDR Hash
9.      size_t value = 0;
10.       for (auto ch : s)
11.       {
12.         value += ch;
13.         value *= 131;
14.       }
15. 
16.       return value;
17.     }
18.   };

(2)哈希桶节点

哈希桶只需要2个成员:数据、下一个桶指针

1.  template<class T>
2.  struct HashNode
3.  {
4.    HashNode<T>* _next;
5.    T _data;
6. 
7.    HashNode(const T& data)
8.      :_next(nullptr)
9.      , _data(data)
10.     {}
11.   };

(3)哈希表

哈希表有两个成员:哈希表、有效数据的个数

1.  template<class K,class V,class HashFunc=Hash<K>>
2.  class HashTable
3.  {
4.    typedef HashNode<K, V> Node;
5. private:
6.    vector<Node*> _table;//哈希表
7.    size_t _n;//有效数据个数
8.  };

(4)查找

先计算key在哈希表中的位置,然后后再该位置的哈希桶中遍历查找:

1.    //查找
2.    Node* Find(const K& key)
3.    {
4.      //哈希表为空
5.      if (_table.size() == 0)
6.      {
7.        return false;
8.      }
9. 
10.       HashFunc hf;
11.       size_t index = hf(key) % _table.size();//计算key在哈希表中的位置
12.       Node* cur = _table[index];
13. 
14.       while (cur)
15.       {
16.         if (cur->_kv.first == key)//找到了
17.         {
18.           return cur;
19.         }
20.         else//没找到
21.         {
22.           cur = cur->_next;
23.         }
24.       }
25. 
26.       return nullptr;
27.     }

(5)插入

①查找key在不在哈希表中

②不在就要先判断哈希表是否满了

③若哈希表满了就要重新开一个新的哈希表,将旧表数据全部头插到新表中

④插入数据

1.    //插入
2. bool Insert(const pair<K, V>& kv)
3.    {
4.      //在哈希表中已存在
5.      if (Find(kv))
6.      {
7.        return false;
8.      }
9. 
10.       //哈希表负载因子为1时代表哈希表满了,需要重新开新表,重新计算映射位置
11.       HashFunc hf;
12.       if (_n == _table.size())
13.       {
14.         vector<Node*> newHashTable;
15.         newHashTable.resize(GetNextPrime(_table.size()));
16. 
17.         //遍历旧表的所有节点,重新挂到新表中,可能节点映射的位置也发生了变化
18.         for (size_t i = 0; i < _table.size(); i++)
19.         {
20.           if (_table[i])
21.           {
22.             Node* cur = _table[i];
23.             while (cur)
24.             {
25.               Node* next = cur->_next;
26.               size_t index = hf(cur->_kv.first) % newHashTable.size();
27. 
28.               //由于是头插,因此将旧表_table的每个桶的_next都置为新表计算的新位置的第一个桶,将新表的newHashTable[index]置为cur
29.               cur->_next = newHashTable[index];
30.               newHashTable[index] = cur;
31.               cur = next;
32.             }
33. 
34.             _table[i] = nullptr;
35.           }
36.         }
37.         _table.swap(newHashTable);
38.       }
39. 
40.       size_t index = hf(kv.first) % _table.size();
41.       Node* newNode = new Node(kv);
42. 
43.       //不需要增容,直接头插
44.       newNode->_next = _table[index];
45.       _table[index] = newNode;
46.       _n++;
47. 
48.       return true;
49.     }

(6)删除

①计算key在表中的位置

②要删除的数据是不是该位置的第一个哈希桶,如果是,那就让哈希表的第一个节点变成第二个桶,否则让这个桶的前一个桶指向这个桶的下一个桶

1.    //删除
2.    bool Erase(const K& key)
3.    {
4.      size_t index = hf(key) % _table.size();
5.      Node* prev = nullptr;
6.      Node* cur = _table[index];
7. 
8.      while (cur)
9.      {
10.         if (cur->_kv.first == key)
11.         {
12.           if (_table[index] == cur)//要删除的key就是该位置的第一个桶
13.           {
14.             _table[index] = cur->_next;
15.           }
16.           else
17.           {
18.             prev->_next = cur->_next;
19.           }
20. 
21.           --_n;
22.           delete cur;
23.           return true;
24. 
25.         }
26. 
27.         prev = cur;
28.         cur = cur->next;
29. 
30.         return false;
31.       }
32.     }

(7)完整代码段

HashTable.h

1. namespace OpenHash
2. {
3.  template<class K>
4.  struct Hash
5.  {
6.    size_t operator()(const K& key)
7.    {
8.      return key;
9.    }
10.   };
11. 
12.   //特化
13.   template<>
14.   struct Hash<string>
15.   {
16.     size_t operator()(const string& s)
17.     {
18.       //采用BKDR哈希计算
19.       size_t value = 0;
20.       for (auto e : s)
21.       {
22.         value += e;
23.         value *= 131;
24.       }
25. 
26.       return value;
27.     }
28.   };
29. 
30.   template<class K, class V>
31.   struct HashNode
32.   {
33.     pair<K, V> _kv;
34.     HashNode<K, V>* _next;
35. 
36.     HashNode(const pair<K, V>& kv)
37.       :_kv(kv)
38.       , _next(nullptr)
39.     {}
40.   };
41. 
42.   template<class K,class V,class HashFunc=Hash<K>>
43.   class HashTable
44.   {
45.     typedef HashNode<K, V> Node;
46.   public:
47. 
48.     //获取质数
49.     size_t GetNextPrime(size_t prime)
50.     {
51.       const int PRIMECOUNT = 28;
52.       static const size_t primeList[PRIMECOUNT] =
53.       {
54.         53ul, 97ul, 193ul, 389ul, 769ul,
55.         1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
56.         49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
57.         1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
58.         50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
59.         1610612741ul, 3221225473ul, 4294967291ul
60.       };
61. 
62.       size_t i = 0;
63.       for (i = 0; i < PRIMECOUNT; i++)
64.       {
65.         if (primeList[i] > prime)
66.         {
67.           return primeList[i];
68.         }
69.       }
70. 
71.       return primeList[i];
72.     }
73. 
74.     bool Insert(const pair<K, V>& kv)
75.     {
76.       //在哈希表中已存在
77.       if (Find(kv))
78.       {
79.         return false;
80.       }
81. 
82.       //哈希表负载因子为1时代表哈希表满了,需要重新开新表,重新计算映射位置
83.       HashFunc hf;
84.       if (_n == _table.size())
85.       {
86.         vector<Node*> newHashTable;
87.         newHashTable.resize(GetNextPrime(_table.size()));
88. 
89.         //遍历旧表的所有节点,重新挂到新表中,可能节点映射的位置也发生了变化
90.         for (size_t i = 0; i < _table.size(); i++)
91.         {
92.           if (_table[i])
93.           {
94.             Node* cur = _table[i];
95.             while (cur)
96.             {
97.               Node* next = cur->_next;
98.               size_t index = hf(cur->_kv.first) % newHashTable.size();
99. 
100.              //由于是头插,因此将旧表_table的每个桶的_next都置为新表计算的新位置的第一个桶,将新表的newHashTable[index]置为cur
101.              cur->_next = newHashTable[index];
102.              newHashTable[index] = cur;
103.              cur = next;
104.            }
105. 
106.            _table[i] = nullptr;
107.          }
108.        }
109.        _table.swap(newHashTable);
110.      }
111. 
112.      size_t index = hf(kv.first) % _table.size();
113.      Node* newNode = new Node(kv);
114. 
115.      //不需要增容,直接头插
116.      newNode->_next = _table[index];
117.      _table[index] = newNode;
118.      _n++;
119. 
120.      return true;
121.    }
122. 
123.    //查找
124.    Node* Find(const K& key)
125.    {
126.      //哈希表为空
127.      if (_table.size() == 0)
128.      {
129.        return false;
130.      }
131. 
132.      HashFunc hf;
133.      size_t index = hf(key) % _table.size();//计算key在哈希表中的位置
134.      Node* cur = _table[index];
135. 
136.      while (cur)
137.      {
138.        if (cur->_kv.first == key)//找到了
139.        {
140.          return cur;
141.        }
142.        else//没找到
143.        {
144.          cur = cur->_next;
145.        }
146.      }
147. 
148.      return nullptr;
149.    }
150. 
151.    //删除
152.    bool Erase(const K& key)
153.    {
154.      size_t index = hf(key) % _table.size();
155.      Node* prev = nullptr;
156.      Node* cur = _table[index];
157. 
158.      while (cur)
159.      {
160.        if (cur->_kv.first == key)
161.        {
162.          if (_table[index] == cur)//要删除的key就是该位置的第一个桶
163.          {
164.            _table[index] = cur->_next;
165.          }
166.          else
167.          {
168.            prev->_next = cur->_next;
169.          }
170. 
171.          --_n;
172.          delete cur;
173.          return true;
174. 
175.        }
176. 
177.        prev = cur;
178.        cur = cur->next;
179. 
180.        return false;
181.      }
182.    }
183.  private:
184.    vector<Node*> _table;//哈希表
185.    size_t _n;//有效数据个数
186.  };  
187. }
相关文章
|
5月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
124 2
|
6月前
|
存储 算法 C++
Windows共享文件:探秘C++实现的B树索引算法奇境
在数字化时代,Windows共享文件的高效管理至关重要。B树算法以其自平衡多路搜索特性,在文件索引与存储优化中表现出色。本文探讨B树在Windows共享文件中的应用,通过C++实现具体代码,展示其构建文件索引、优化数据存储的能力,提升文件检索效率。B树通过减少磁盘I/O操作,确保查询高效,为企业和个人提供流畅的文件共享体验。
|
7月前
|
存储 负载均衡 算法
基于 C++ 语言的迪杰斯特拉算法在局域网计算机管理中的应用剖析
在局域网计算机管理中,迪杰斯特拉算法用于优化网络路径、分配资源和定位故障节点,确保高效稳定的网络环境。该算法通过计算最短路径,提升数据传输速率与稳定性,实现负载均衡并快速排除故障。C++代码示例展示了其在网络模拟中的应用,为企业信息化建设提供有力支持。
190 15
|
7月前
|
运维 监控 算法
解读 C++ 助力的局域网监控电脑网络连接算法
本文探讨了使用C++语言实现局域网监控电脑中网络连接监控的算法。通过将局域网的拓扑结构建模为图(Graph)数据结构,每台电脑作为顶点,网络连接作为边,可高效管理与监控动态变化的网络连接。文章展示了基于深度优先搜索(DFS)的连通性检测算法,用于判断两节点间是否存在路径,助力故障排查与流量优化。C++的高效性能结合图算法,为保障网络秩序与信息安全提供了坚实基础,未来可进一步优化以应对无线网络等新挑战。
|
7月前
|
存储 算法 数据处理
公司局域网管理中的哈希表查找优化 C++ 算法探究
在数字化办公环境中,公司局域网管理至关重要。哈希表作为一种高效的数据结构,通过哈希函数将关键值(如IP地址、账号)映射到数组索引,实现快速的插入、删除与查找操作。例如,在员工登录验证和设备信息管理中,哈希表能显著提升效率,避免传统线性查找的低效问题。本文以C++为例,展示了哈希表在局域网管理中的具体应用,包括设备MAC地址与IP分配的存储与查询,并探讨了优化哈希函数和扩容策略,确保网络管理高效准确。
|
3月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
97 0
|
4月前
|
存储 机器学习/深度学习 算法
基于 C++ 的局域网访问控制列表(ACL)实现及局域网限制上网软件算法研究
本文探讨局域网限制上网软件中访问控制列表(ACL)的应用,分析其通过规则匹配管理网络资源访问的核心机制。基于C++实现ACL算法原型,展示其灵活性与安全性。文中强调ACL在企业与教育场景下的重要作用,并提出性能优化及结合机器学习等未来研究方向。
118 4
|
5月前
|
监控 算法 数据处理
基于 C++ 的 KD 树算法在监控局域网屏幕中的理论剖析与工程实践研究
本文探讨了KD树在局域网屏幕监控中的应用,通过C++实现其构建与查询功能,显著提升多维数据处理效率。KD树作为一种二叉空间划分结构,适用于屏幕图像特征匹配、异常画面检测及数据压缩传输优化等场景。相比传统方法,基于KD树的方案检索效率提升2-3个数量级,但高维数据退化和动态更新等问题仍需进一步研究。未来可通过融合其他数据结构、引入深度学习及开发增量式更新算法等方式优化性能。
152 17
|
5月前
|
存储 监控 算法
内网监控桌面与 PHP 哈希算法:从数据追踪到行为审计的技术解析
本文探讨了内网监控桌面系统的技术需求与数据结构选型,重点分析了哈希算法在企业内网安全管理中的应用。通过PHP语言实现的SHA-256算法,可有效支持软件准入控制、数据传输审计及操作日志存证等功能。文章还介绍了性能优化策略(如分块哈希计算和并行处理)与安全增强措施(如盐值强化和动态更新),并展望了哈希算法在图像处理、网络流量分析等领域的扩展应用。最终强调了构建完整内网安全闭环的重要性,为企业数字资产保护提供技术支撑。
144 2
|
4月前
|
机器学习/深度学习 存储 算法
基于 C++ 布隆过滤器算法的局域网上网行为控制:URL 访问过滤的高效实现研究
本文探讨了一种基于布隆过滤器的局域网上网行为控制方法,旨在解决传统黑白名单机制在处理海量URL数据时存储与查询效率低的问题。通过C++实现URL访问过滤功能,实验表明该方法可将内存占用降至传统方案的八分之一,查询速度提升约40%,假阳性率可控。研究为优化企业网络管理提供了新思路,并提出结合机器学习、改进哈希函数及分布式协同等未来优化方向。
101 0

热门文章

最新文章