一致性哈希算法(consistent hashing)例子+测试。 .

简介:

一个简单的consistent hashing的例子,很容易理解。

首先有一个设备类,定义了机器名和ip:

[java]  view plain copy print ? 在CODE上查看代码片 派生到我的代码片
  1. public class Cache  
  2. {  
  3.     public String name;  
  4.     public String ipAddress;  
  5. }  

然后是主要的实现:

[java]  view plain copy print ? 在CODE上查看代码片 派生到我的代码片
  1. public class Shard<T> {   
  2.     //hash 算法并不是保证绝对的平衡,如果 cache 较少的话,对象并不能被均匀的映射到 cache 上,   
  3.     //所以增加虚拟节点   
  4.     private TreeMap<Long, T> nodes;  
  5.     private List<T> shards; //节点碎片   
  6.     private final int NODE_NUM = 10// 每个机器节点关联的虚拟节点个数   
  7.   
  8.     public Shard(List<T> shards) {  
  9.         this.shards = shards;  
  10.         init();  
  11.     }  
  12.   
  13.     private void init() {   
  14.         nodes = new TreeMap<Long, T>();  
  15.         for (int i = 0; i < shards.size(); i++)   
  16.         { // 遍历真实节点   
  17.             final T shardInfo = shards.get(i);  
  18.               
  19.             for (int n = 0; n < NODE_NUM; n++)  
  20.             {  
  21.                 // 真实节点关联虚拟节点,真实节点是VALUE;   
  22.                 nodes.put((long) Hash("SHARD-" + i + "-NODE-" + n), shardInfo);  
  23.             }  
  24.             System.out.println(shardInfo);  
  25.         }  
  26.     }  
  27.   
  28.     public T getShardInfo(String key) {  
  29.         SortedMap<Long, T> tail = nodes.tailMap((long) Hash(key));   
  30.         if (tail.size() == 0) {  
  31.             return nodes.get(nodes.firstKey());  
  32.         }  
  33.         //找到最近的虚拟节点   
  34.         return tail.get(tail.firstKey());  
  35.     }  
  36.       
  37.     /** 
  38.      * 改进的32位FNV算法,高离散 
  39.      *  
  40.      * @param string 
  41.      *            字符串 
  42.      * @return int值 
  43.      */  
  44.     public static int Hash(String str)   
  45.     {  
  46.         final int p = 16777619;  
  47.         int hash = (int) 2166136261L;  
  48.         for (byte b : str.getBytes())  
  49.             hash = (hash ^ b) * p;  
  50.         hash += hash << 13;  
  51.         hash ^= hash >> 7;  
  52.         hash += hash << 3;  
  53.         hash ^= hash >> 17;  
  54.         hash += hash << 5;  
  55.         return hash;  
  56.     }  
  57.   
  58. }  


到这里就完了,是不是很简单,下面来测试下:

[java]  view plain copy print ? 在CODE上查看代码片 派生到我的代码片
  1. public class Test  
  2. {  
  3.   
  4.     /** 
  5.      * @param args 
  6.      */  
  7.     public static void main(String[] args)  
  8.     {  
  9.         List<Cache> myCaches=new ArrayList<Cache>();  
  10.         Cache cache1=new Cache();  
  11.         cache1.name="COMPUTER1";  
  12.         Cache cache2=new Cache();  
  13.         cache2.name="COMPUTER2";  
  14.         myCaches.add(cache1);  
  15.         myCaches.add(cache2);  
  16.           
  17.           
  18.         Shard<Cache> myShard=new Shard<Cache>(myCaches);  
  19.           
  20.         Cache currentCache=myShard.getShardInfo("info1");  
  21.         System.out.println(currentCache.name);  
  22.           
  23. //      for(int i=0;i<20;i++)   
  24. //      {   
  25. //          String object=getRandomString(20);//产生20位长度的随机字符串   
  26. //          Cache currentCache=myShard.getShardInfo(object);   
  27. //          System.out.println(currentCache.name);   
  28. //      }   
  29.           
  30.           
  31.     }  
  32.       
  33.     public static String getRandomString(int length) { //length表示生成字符串的长度   
  34.         String base = "abcdefghijklmnopqrstuvwxyz0123456789";     
  35.         Random random = new Random();     
  36.         StringBuffer sb = new StringBuffer();     
  37.         for (int i = 0; i < length; i++) {     
  38.             int number = random.nextInt(base.length());     
  39.             sb.append(base.charAt(number));     
  40.         }     
  41.         return sb.toString();     
  42.      }     
  43.   
  44. }  


我们有两台设备,computer1和computer2,第一次初始化要构建一个2的32次方的环,并往上面放设备。这个环由改进的FNV算法实现。位置也由hash算法确定。

但我们只有两台设备,很明显在环上会分布不均匀(这个就不解释了,网上很多资料)。于是我们每台设备增加10个虚拟设备。

最后分布如下:

[html]  view plain copy print ? 在CODE上查看代码片 派生到我的代码片
  1. <SPAN style="COLOR: #003300">-1561290727=Hash.Cache@10f11b8,  
  2. -1083588870=Hash.Cache@10f11b8,  
  3. -697149481=Hash.Cache@10f11b8,  
  4. -253517545=Hash.Cache@10f11b8,  
  5. 397383558=Hash.Cache@10f11b8,  
  6. 1078505027=Hash.Cache@10f11b8,  
  7. 1810977445=Hash.Cache@10f11b8,  
  8. 1844081498=Hash.Cache@10f11b8,  
  9. 2004894833=Hash.Cache@10f11b8,  
  10. 2051863688=Hash.Cache@10f11b8</SPAN>  

-2147483648到2147483647之间是不是比较均匀,这是java的,如果是c#的就是0~2的32次方。我们hash计算出KEY值为2049553054,然后顺时针找到最近的位置,即为

2051863688=Hash.Cache@10f11b8

结果我们定位到了COMPUTER1

最好我们要看看平衡性如何:取消上面注释的代码,循环20次,得到结果如下:

COMPUTER1
COMPUTER2
COMPUTER1
COMPUTER2
COMPUTER1
COMPUTER2
COMPUTER1
COMPUTER1
COMPUTER1
COMPUTER2
COMPUTER2
COMPUTER2
COMPUTER1
COMPUTER2
COMPUTER1
COMPUTER1
COMPUTER1
COMPUTER2
COMPUTER1
COMPUTER2

大家可以自己取试试,

FNV哈希算法是一种高离散性的哈希算法,特别适用于哈希非常相似的字符串,例如:URL,IP,主机名,文件名等。

以下服务使用了FNV:
1、calc
2、DNS
3、mdbm key/value查询函数
4、数据库索引hash
5、主流web查询/索引引擎
6、高性能email服务
7、基于消息ID查询函数
8、auti-spam反垃圾邮件过滤器
9、NFS实现(比如freebsd 4.3, linux NFS v4)
10、Cohesia MASS project 
11、Ada 95的spellchecker
12、开源x86汇编器:flatassembler   user-defined symbol hashtree
13、PowerBASIC
14、PS2、XBOX上的文本资源
15、非加密图形文件指纹
16、FRET
17、Symbian DASM
18、VC++ 2005的hash_map实现
19、memcache中的libketama
20、 PHP 5.x 
21、twitter中用于改进cache碎片
22、BSD IDE project
23、deliantra game server
24、 Leprechaun
25、IPv6流标签

<!-- Baidu Button BEGIN -->

目录
相关文章
|
8月前
|
传感器 算法 计算机视觉
基于肤色模型和中值滤波的手部检测算法FPGA实现,包括tb测试文件和MATLAB辅助验证
该内容是关于一个基于肤色模型和中值滤波的手部检测算法的描述,包括算法的运行效果图和所使用的软件版本(matlab2022a, vivado2019.2)。算法分为肤色分割和中值滤波两步,其中肤色模型在YCbCr色彩空间定义,中值滤波用于去除噪声。提供了一段核心程序代码,用于处理图像数据并在FPGA上实现。最终,检测结果输出到&quot;hand.txt&quot;文件。
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
63 1
|
3月前
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
81 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
|
5月前
|
算法
测试工程师的技能升级:LeetCode算法挑战与职业成长
这篇文章通过作者亲身体验LeetCode算法题的过程,探讨了测试工程师学习算法的重要性,并强调了算法技能对于测试职业成长的必要性。
85 1
测试工程师的技能升级:LeetCode算法挑战与职业成长
|
3月前
|
算法 Java 测试技术
数据结构 —— Java自定义代码实现顺序表,包含测试用例以及ArrayList的使用以及相关算法题
文章详细介绍了如何用Java自定义实现一个顺序表类,包括插入、删除、获取数据元素、求数据个数等功能,并对顺序表进行了测试,最后还提及了Java中自带的顺序表实现类ArrayList。
41 0
|
5月前
|
机器学习/深度学习 自然语言处理 算法
利用机器学习算法进行自动化测试
利用机器学习算法进行自动化测试
|
5月前
|
算法 安全 测试技术
Go - 常用签名算法的基准测试
Go - 常用签名算法的基准测试
44 2
|
6月前
|
缓存 算法 NoSQL
Java中的分布式缓存与一致性哈希算法
Java中的分布式缓存与一致性哈希算法
|
6月前
|
算法
基于Dijkstra算法的最优行驶路线搜索matlab仿真,以实际城市复杂路线为例进行测试
使用MATLAB2022a实现的Dijkstra算法在城市地图上搜索最优行驶路线的仿真。用户通过鼠标点击设定起点和终点,算法规划路径并显示长度。测试显示,尽管在某些复杂情况下计算路径可能与实际有偏差,但多数场景下Dijkstra算法能找到接近最短路径。核心代码包括图的显示、用户交互及Dijkstra算法实现。算法基于图论,不断更新未访问节点的最短路径。测试结果证明其在简单路线及多数复杂城市路况下表现良好,但在交通拥堵等特殊情况下需结合其他数据提升准确性。
|
7月前
|
存储 NoSQL 算法
Redis集群,集群的概念 三种主流分片方式1.哈希求余 一致性哈希算法:方案三:哈希槽分区算法问题一Redis集群是最多有16384个分片吗问题二:为什么是16384个,集群扩容:1.新的主节点
Redis集群,集群的概念 三种主流分片方式1.哈希求余 一致性哈希算法:方案三:哈希槽分区算法问题一Redis集群是最多有16384个分片吗问题二:为什么是16384个,集群扩容:1.新的主节点