一致性 Hash 算法 Hash 环发生偏移怎么解决

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
EMR Serverless StarRocks,5000CU*H 48000GB*H
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 一致性 Hash 算法 Hash 环发生偏移怎么解决
本篇是对文章《一文彻底读懂一致性哈希算法》的重写,图文并茂,篇幅较长,欢迎阅读完提供宝贵的建议,一起提升文章质量。如果感觉不错不要忘记点赞、关注、转发哦。

原文链接:

《一文彻底读懂一致性Hash 算法》

通过阅读本文你可以获得如下内容:

背景

我们的场景就是大数据量的图片(或者缓存请求)能够在多个服务器之间进行负载均衡,实现在某个服务器发生故障时最小的影响系统,尽量的减少图片无法查看的请求。

那么我们为什么要提到一致性 Hash 算法呢,简单的Hash 算法不能满足我们的需求吗?下面跟我一起来学习下一致性 Hash 算法是如何解决我们的问题的。

为什么要用一致性 Hash 算法?

为什么要用一致性 Hash 算法,那肯定是因为它有优点,优点就是可以尽可能小的改变已存在的服务请求与处理请求服务器之间的映射关系,从而提高系统的可伸缩性和容错性

  1. 负载均衡: 一致性哈希算法能够在节点的增加或减少时最小化数据迁移的数量。在传统的哈希算法中,当节点发生变化时,几乎所有的数据都需要重新分配,导致大量的数据迁移。而一致性哈希只需要迁移一小部分数据,使得负载更加均衡。
  2. 容错性: 当系统中的节点发生故障或需要扩展时,一致性哈希算法能够最小化数据的丢失或迁移。新节点加入或旧节点离开时,只有部分数据需要重新映射,而不是整个数据集。
  3. 可伸缩性: 一致性哈希算法支持动态地添加或删除节点,而不需要重新计算大部分数据的映射关系。这使得系统更容易扩展,同时减少了系统维护的复杂性。
  4. 简化路由表: 在一致性哈希中,每个节点仅负责一小部分数据,因此路由表的大小相对较小。这降低了路由表的存储和维护成本。
  5. 分布式存储: 一致性哈希常被用于分布式存储系统,如分布式缓存、分布式文件系统等。它能够有效地处理大规模数据集的分片和分布,提高系统的性能和可扩展性。

总的来说,一致性哈希算法通过减小数据迁移的范围,提高了分布式系统的可伸缩性、容错性和负载均衡性,使得系统更具弹性和效率。

普通 Hash 算法有什么缺点?

通过一个例子来看一下简单 Hash 算法有什么缺点。

假设我们有三台缓存服务器A、B、C用于缓存图片,现在需要对请求过来的图片均匀的缓存在这三台服务器上,以便它们均摊缓存图片的请求。

假设有三万张图片需要缓存,也就是每台服务器平均缓存一万张左右。如果我们以没有任何规律的方式把三万张图片平均的缓存在三台服务器上,也能满足我们的需求,但是如果这样做的话,会有什么问题呢?想想看?

问题就是:

当我们访问某一张图片时,最差的情况是需要遍历三台服务器,从三万个缓存中找到我们所需要的缓存,这样的话其实也就失去了缓存的意义,并没有改善用户的体验。那么我们可以怎么做呢,原始的做法就是对图片名称进行 Hash 运算(假设图片名称是唯一的),将 Hash 后的结果与服务器数量进行取模操作,通过取模后的结果来决定缓存该存在哪个服务器上,那么我们可以使用如下公式来决定图片应该存在哪台服务器上?

其中 N 为服务器的数量。

hash(图片名称)%N

因为图片的名称是不重复的,所以当我们对一个图片名称做相同的 Hash 计算时,得到的结果应该是不变的。

如果我们有三台服务器,使用哈希后的结果就是对3进行取余,那么余数一定是0、1、2三个中的一个,没错,正好对应我们的服务器A、B、C,所以如果求余的结果是0,那么我们就可以把图片缓存在服务器A上,相反,如果取余的结果是1,那就是缓存在服务器B上。

那么当我们访问任意一个图片时,只需要对图片名称进行上述的操作即可知道图片缓存在哪个服务器上。如果图片在对应的服务器上不存在,则证明对应的图片没缓存,也就不需要再去其它的服务器上查询了,通过这样的方法,就可以平均的把三万张图片分散的放在三台服务器上,而且当下次访问某张图片时,直接就能判断出当前图片所在的服务器,这样就能满足我们的需求了。

当使用了上面的哈希算法之后还会有什么问题呢,试想一下,如果三台缓存服务器已经不能满足我们的缓存需求,那么我们是不是要增加一台,那么缓存服务器的数量就由3台变成4台了,此时如果仍然采用上述方法对同一张图片进行缓存,那么这张图片所在的服务器编号必定与原来三台服务器时产生的结果不一致,这种情况带来的后果就是当缓存服务器数量发生变动时,所有缓存的位置都要发生改变

换句话说,当服务器数量发生改变时,所有缓存在一定时间内是失效的,当请求无法从缓存中读取到数据时,则会向后端服务器发送请求,同理,假设三台服务器其中有一台服务器发生了故障,无法进行缓存,那么我们就需要将故障机器移除,此时响应的缓存服务器数量也是发生了变化,以前缓存的图片也就失去了意义,此时大量图片缓存失效,造成缓存雪崩,此时缓存无法在分担压力,后端服务器将承受压力,整个系统也就有可能被压垮,所以我们要想办法不让这种情况发生,但是由于上述哈希算法本身的缘故,使用取模算法进行缓存时,这种情况是不可避免的,为了解决这些问题,一致性 Hash 算法也就应运而生了。

所以我们来回顾下使用简单 Hash 算法会产生的问题:

  • 当缓存服务器数量发生变化时,引起缓存大量失效,缓存雪崩,可能会使后端服务器压力变大而崩溃。
  • 当缓存服务器数量发生变化时,几乎所有的缓存位置都会发生变化,那我们怎样才能减少受影响的缓存呢?

其实,这两个问题都可以使用一致性 Hash 算法解决,现在我们继续深入了解一下一致性 Hash 算法。

什么是一致性 Hash 算法?

一致性哈希算法是1997年在论文《Consistent hashing and random trees》中被提出的,在分布式系统中应用非常广泛。一致性Hash 是一种 Hash 算法,简单的说就是在移除或者添加一个服务器时,此算法能够尽可能小的改变已存在的服务请求与处理请求服务器之间的映射关系,尽可能满足单调性的要求。

在普通分布式集群中,服务请求与处理请求服务器之间可以一一对应,也就是说固定服务请求与处理服务器之间的映射关系,某个请求由固定的服务器去处理。这种方式无法对整个系统进行负载均衡,可能会造成某些服务器过于繁忙一直无法处理新来的请求,而另一些服务器则过于空闲,整体系统的资源利用率低,并且当分布式集群中的某个服务器宕机,会直接导致某些服务请求无法处理

进一步的改进可以利用 Hash 算法对服务请求进行处理服务器之间的关系进行映射,以达到动态分配的目的。通过 Hash 算法对服务请求进行转换,转换后的结果对服务器节点值进行取模计算,取模后的值就是服务请求对应的请求处理服务器。这种方法可以应对节点失效的情况,当某个分布式集群节点宕机,服务请求可以通过 Hash 算法重新分配到其他可用的服务器上。避免了无法处理请求的情况出现。

但这种方法的缺陷也很明显,如果服务器中保存有服务请求对应的数据,那么如果重新计算请求的 Hash 值,会造成大量的请求被重定位到不同的服务器而造成请求所需要的数据无效,这种情况在分布式系统中是难以接受的。一个设计良好的分布式系统应该具有良好的单调性,即服务器的添加与移除不会造成大量的哈希重定位,而一致性哈希恰好可以解决这个问题

一致性哈希算法将整个哈希值空间映射一个虚拟的圆环,整个哈希空间的取值范围为 0~232 ^{32}32-1 ,整个空间按顺时针方向。0~232 ^{32}32-1,在零点方向重合。接下来使用如下算法对请求进行映射,将服务请求使用 Hash 算法算出对应的 Hash值,然后根据 Hash 值的位置沿圆环顺时针查找,遇到的第一个服务器就是所对应的处理请求服务器。当增加一台新的服务器,受影响的数据仅仅是新添加的服务器到其环空间中前一台的服务器(也就是顺着逆时针方向遇到的第一台服务器)之间的数据,其它都不会受到影响。综上所述,一致性哈希算法对于节点的增减都只需重定位环空间中的一小部分数据,具有较好的容错性可扩展性

首先,一致性哈希算法是采用取模的方法,只是,刚才的取模算法是对服务器数量进行取模,那么我们只要不对服务器数量进行取模,而对一个常量进行取模不就可以了吗,所以一致性哈希算法是对232 ^{32}32进行取模,我们把0-232 ^{32}32次方想象成一个圆,就像钟表一样的圆,钟表的圆可以想象是圆上有60个点,而我们的这个圆是由232 ^{32}32个点组成的圆,示意图如下:

圆的正上方的点代表0,0点右侧第一个点代表1,左侧第一个点代表232 ^{32}32-1,我们把0-232 ^{32}32-1之间的圆环称之为 Hash 环。

下面,跟我一起看下一致性 Hash 算法是怎么在这个圆上来体现的。

首先我们还是有三台服务器,分别是服务器A,服务器B,服务器C,那么在我们的生产环境中,我们对这三台服务器的 IP 地址进行 Hash,用 Hash 后的结果对232 ^{32}32进行取模运算,得到的结果就是服务器的位置。

Hash(服务器IP地址)%232 ^{32}32

通过这个公式计算的结果肯定是0-232 ^{32}32-1之间的一个数,我们就用这个数代表服务器A。

然后我们用同样的方法,计算出服务器B,和服务器C的位置,表示如下。

假设三台服务器经过计算之后的位置如上图所示(理想情况下是这个样子,但是现实往往很无情)。

好了,到这里,我们已经把服务器与Hash环绑定到了一起,下面就是把数据绑定到 Hash环上,那么我们下面就用同样的方法把需要缓存的对象放到Hash环上。

还是按照刚才的例子,对三万张图片进行缓存,此时我们还是使用如下公式。

Hash(图片名称)%232 ^{32}32

第一张图片映射的结果如下图所示(假设)。

那么图片1保存在哪台服务器上去呢,上面的图片会被缓存到服务器A上,为什么会这样呢?因为从图片1的位置开始,沿顺时针方向遇到的第一个服务器就是服务器A,所以上图会被缓存到服务器A上,如下图所示:

所以一致性 Hash 算法就是通过这种方法来判断对象该存储在哪台服务器上的,也就是将缓存服务器与缓存对象绑定到 Hash 环上之后,从被缓存的对象开始,顺时针方向遇到的第一台服务器就是缓存对象要存储的服务器,由于缓存对象对服务器 Hash 后的值是固定的,所以在服务器不变的情况下,一张图片必定会缓存在固定的服务器上,所以当下次访问该图片时,只要再次使用同样的哈希算法计算,即可获取出该图片在哪台服务器上,然后直接去对应的服务器上获取即可。

刚才的示例是一张图片,下面演示一下多张图片的位置。

图片1,图片4会缓存在服务器A上,图片2缓存在服务器B上,图片3缓存在服务器C上。

经过上面的描述,我想同学们应该能够知道一致性 Hash 的原理了,所以同学们考虑一下,一致性 Hash 可以解决上面的两个问题吗?首先还是第一个问题,当服务器数量发生变动时,缓存会同一时间大量失效造成缓存雪崩,从而有可能引发系统的崩溃,那么使用一致性Hash 算法能够避免这个问题吗,下面我们来看一下。

假设服务器B出现故障,现在我们需要把服务器B移除掉,那么我们从 Hash 环上移除服务器B之后如下所示:

在服务器B没有故障未被移除时,图片2应该是缓存在服务器B上,可是当服务器B有了故障被移除后,图片2按照顺时针方向遇到的第一个服务器就变成了服务器C,所以此时图片2就被缓存在服务器C中,也就是说,如果服务器B出现故障,图片2的缓存位置会发生变化。

此时,图片3仍然会被缓存中服务器C中,图片1与图片4缓存在服务器A中,这与服务器B移除前后并不会有影响,这也就是 Hash 算法的优点,如果使用之前的 Hash 算法,服务器数量发生变化时,所有的缓存对象都会发生变化,而使用一致性哈希算法之后,服务器的数量如果发生变化,并不是所有的缓存都会失效,而只有部分缓存才会失效,所以这种情况下不至于所有的缓存失效,都在同一时间集中到后端服务器上。

思考一下:通过上面的学习,可以知道了一致性 Hash 算法带来的优点了,那么有什么缺点呢或者说有什么需要注意的点呢?这块你可以想到吗?

一致性 Hash 算法有什么缺点?

在这里也是给同学们举例说明。

在介绍一致性哈希时,我们是非常理想化的假设3台服务器均匀的分布在 Hash 环上,如下图所示:

但是往往现实不会如此,在实际的使用过程中,服务器有可能会被映射为如下图所示的情况:

聪明的你肯定想到如果发生了这种情况,那么缓存的对象可能会集中的缓存在一台服务器上,这也就是 Hash 环的倾斜,如下图所示:

此时,如图所示,图片1,图片3,图片4,图片5都会缓存到服务器A上,图片2缓存中服务器B上,服务器C上没有图片,也就是说,服务器资源并没有理想化平均的被使用。最坏的情况下,如果此时服务器A发生故障,那缓存失效的对象也就达到了最大值,极端情况下也有可能造成后端服务器的崩溃。此时这种情况称之为 Hash 环的倾斜,那么怎么防止 Hash 环的倾斜呢,一致性hash算法使用虚拟节点来解决了这个问题,下面我们来看看。

如何最小化一致性 Hash算法带来的影响?

还是按照我们说的,假设我们只有三台服务器,当我们把服务器映射到 Hash 环上的时候,很有可能发生 Hash 环偏斜的情况,当 Hash环偏斜以后,缓存往往会极度不平衡的分布在各个服务器上,聪明的你肯定想到了,要想均衡的将缓存分布在三台服务器上,那么只要这三台服务器尽可能多的均匀的分布在H ash 环不就行了吗,但是真实的服务器资源只有3台,我们怎么凭空让它多起来呢,没错,就是凭空让服务器的节点多起来,既然没有多余的真正的物理服务器节点,我们只能将现有的物理节点虚拟出来,这些由实际节点虚拟复制出来的节点被称为“虚拟节点”,加入虚拟节点之后的 Hash 环如下图所示:

虚拟节点是实际节点在 Hash 环上的复制品,一个实际节点可以复制多个虚拟节点

从上图可以看出,ABC三台服务器分别虚拟出来一个虚拟节点,当然,如果你需要的话也可以虚拟出更多的节点,此时为了画图演示,我们各只虚拟出一个节点。

增加了虚拟节点的概念后,缓存的分布就均匀了很多,上图中,图片1,图片3缓存在服务器A,图片2,图片4缓存在服务器B,图片5缓存在服务器C,如果你还不放心的话,可以虚拟出更多的虚拟节点,以便减少 Hash环倾斜带来的影响,虚拟节点越多,Hash环的节点越多,缓存被均匀分布的可能就越大。

所以,此时缓存对象已经均衡的分布在 Hash环上,如果在发生服务器故障,那么受影响的缓存对象就是发生故障的服务器逆时针方向到遇到的第一台服务器之间的数据,受影响的缓存对象大大减少。

总结

读到这了,不知道同学们收获了多少,如果没有记住,没关系,下面我来给大家总结一下开头的几个问题。

  • 为什么要用一致性 Hash 算法
    能够在服务器发生故障时最小化因为故障造成的影响,并且可以提升系统的可伸缩性。
  • 普通 Hash 算法有什么缺点
    其中一台服务器故障,或者新增服务器时,大量缓存同时失效造成缓存雪崩。
  • 什么是一致性 Hash 算法
    一致性 Hash 算法就是可以尽可能小的影响已经存在的请求与服务器的映射关系。
  • 一致性 Hash 算法有什么缺点
    Hash 环偏移。
  • 如何最小化一致性 Hash 算法带来的影响?
    使用虚拟节点。

好了,一致性哈希算法的原理就总结了这里,如果错误,欢迎赐教。如果感觉对你有帮助,欢迎点赞、评论、转发。

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
目录
相关文章
|
6月前
|
消息中间件 算法 分布式数据库
Raft算法:分布式一致性领域的璀璨明珠
【4月更文挑战第21天】Raft算法是分布式一致性领域的明星,通过领导者选举、日志复制和安全性解决一致性问题。它将复杂问题简化,角色包括领导者、跟随者和候选者。领导者负责日志复制,确保多数节点同步。实现细节涉及超时机制、日志压缩和网络分区处理。广泛应用于分布式数据库、存储系统和消息队列,如Etcd、TiKV。其简洁高效的特点使其在分布式系统中备受青睐。
|
6月前
|
算法 分布式数据库
Paxos算法:分布式一致性的基石
【4月更文挑战第21天】Paxos算法是分布式一致性基础,由Leslie Lamport提出,包含准备和提交阶段,保证安全性和活性。通过提案编号、接受者和学习者实现,广泛应用于分布式数据库、锁和配置管理。其简单、高效、容错性强,影响了后续如Raft等算法,是理解分布式系统一致性关键。
|
3月前
|
存储 算法 NoSQL
(七)漫谈分布式之一致性算法下篇:一文从根上儿理解大名鼎鼎的Raft共识算法!
Raft通过一致性检查,能在一定程度上保证集群的一致性,但无法保证所有情况下的一致性,毕竟分布式系统各种故障层出不穷,如何在有可能发生各类故障的分布式系统保证集群一致性,这才是Raft等一致性算法要真正解决的问题。
112 11
|
3月前
|
存储 算法 索引
(六)漫谈分布式之一致性算法上篇:用二十六张图一探Raft共识算法奥妙之处!
现如今,大多数分布式存储系统都投向了Raft算法的怀抱,而本文就来聊聊大名鼎鼎的Raft算法/协议!
114 8
|
3月前
|
存储 算法 Java
(五)漫谈分布式之一致性算法篇:谁说Paxos晦涩难懂?你瞧这不一学就会!
没在时代发展的洪流中泯然于众的道理很简单,是因为它们并不仅是空中楼阁般的高大上理论,而是有着完整落地的思想,它们已然成为构建分布式系统不可或缺的底层基石,而本文则来好好聊聊分布式与一致性思想的落地者:Paxos与Raft协议(算法)。
|
4月前
|
缓存 负载均衡 算法
(四)网络编程之请求分发篇:负载均衡静态调度算法、平滑轮询加权、一致性哈希、最小活跃数算法实践!
先如今所有的技术栈中,只要一谈关于高可用、高并发处理相关的实现,必然会牵扯到集群这个话题,也就是部署多台服务器共同对外提供服务,从而做到提升系统吞吐量,优化系统的整体性能以及稳定性等目的。
|
6月前
|
缓存 负载均衡 算法
C++如何实现一致性算法
一致性哈希是一种用于分布式系统的负载均衡算法,旨在减少服务器增减导致的数据迁移。当有N台服务器时,通过哈希环将请求均匀分布到每台服务器,每台处理N/1的请求。若使用缓存如Redis,可进一步处理高并发场景。算法将哈希值空间视为环形,服务器和请求哈希后定位到环上,按顺时针方向找到第一台服务器作为负载目标。提供的C++代码实现了MD5哈希函数,以及一致性哈希算法的物理节点、虚拟节点和算法本身,以实现节点的添加、删除和请求映射。
47 1
C++如何实现一致性算法
|
5月前
|
算法 Java
Java中常用hash算法总结
Java中常用hash算法总结
41 0
|
6月前
|
资源调度 算法 块存储
m基于遗传优化的LDPC码OMS译码算法最优偏移参数计算和误码率matlab仿真
MATLAB2022a仿真实现了遗传优化的LDPC码OSD译码算法,通过自动搜索最佳偏移参数ΔΔ以提升纠错性能。该算法结合了低密度奇偶校验码和有序统计译码理论,利用遗传算法进行全局优化,避免手动调整,提高译码效率。核心程序包括编码、调制、AWGN信道模拟及软输入软输出译码等步骤,通过仿真曲线展示了不同SNR下的误码率性能。
65 1
|
5月前
|
算法
m基于PSO粒子群优化的LDPC码OMS译码算法最优偏移参数计算和误码率matlab仿真
MATLAB2022a仿真实现了Offset Min-Sum (OMS)译码算法与粒子群优化(PSO)结合,以优化偏移参数,提升LDPC码解码性能。PSO通过迭代寻找最小化误码率(BER)的最佳偏移量。核心程序运用PSO进行参数更新和适应度函数(BER)评估,最终在不同信噪比下展示OMS解码性能,并保存结果。
72 0