Kafka高可用——replica分配方式

简介: Kafka的Replica概念kafka的replica指的是消息的备份,为了保证kafka的高可用(当leader节点挂了之后,kafka依然能提供服务)kafka提供了备份的功能。

Kafka的Replica

概念

kafka的replica指的是消息的备份,为了保证kafka的高可用(当leader节点挂了之后,kafka依然能提供服务)kafka提供了备份的功能。这个备份是针对partition的。

可以通过 default.replication.factor 对replica的数目进行配置,默认值为1,表示不对topic进行备份。如果配置为2,表示除了leader节点,对于topic里的每一个partition,都会有一个额外的备份。

replica分配

为了起到备份的效果,简单设想下,如果让我们来分配replica,我们会怎么分配?
1)replica与所备份的节点不能再一台机器上,否则就起不到备份的效果
2)replica尽量均匀的分布在集群机器上,如果replica全部都在某几台机器上,那么一旦这台机器挂了,会丢失多个partition的备份

假设有3个broker、一个topic1、topic1有3个partition,default.replication.factor被设置为2,可能会这样分配


img_7654f69f203c098f49c7054dc84fc1b9.png
简单的replica分配示意图(圆角矩形代表replica)

这种分配保证了,任何一台机器挂掉,kafka集群依然有备份可用。

replica分配算法

假设有5个broker,10个partitions,备份数设置为3

1、从一个集群的随机节点开始,轮询放置第一个replica

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0 p1 p2 p3 p4 1st replica
p5 p6 p7 p8 p9 1st replica

2、后面的replica增加一个偏移量,继续放置,比如这里的p0,从broker-0开始,下一个replica就从broker-1开始

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0(start) p1 p2 p3 p4 1st replica
p5(start) p6 p7 p8 p9 1st replica
p4 p0 (start) p1 p2 p3 2nd replica
p8 p9 p5(start) p6 p7 2nd replica
p3 p4 p0(start) p1 p2 3rd replica
p7 p8 p9 p5(start) p6 3rd replica

通过这种方式,replica尽可能的被均匀分配在多个broker上

多机房

上述方法,可以保证多个broker存在时,哪怕其中一个broker挂了,kafka依旧能提供服务。但是,当有多个机房时候,这种分配方式,不能保证,跨机房的高可用。

示例:4个broker,4个partition,每个partition有1个备份

img_02396440feae6ac94803a752265ab54a.png
备份(不考虑机房)

按照之前的算法,replica会按照上图所示设置备份。这样假设机房1因为某个原因挂掉了, partition0的数据就会丢失掉。同理,机房2挂了,partition2也会丢失掉。

replica分配算法考虑机房

kafka可以配置一个参数broker.rack说明当前broker在哪个机房。

如上图,配置
broker0 -> rack1
broker1 -> rack1
broker2 -> rack2
broker3 -> rack2

当进行replica排序时候,不会仅仅按照broker顺序进行排序,而是会保证机房错开。比如这种情况的排序可能是
broker0,broker2,broker1,broker3

这样子排序之后,再次按照上述replica分配算法分配。


img_c9baefe5fd0283d3d189d26558ba664d.png
replica分配(考虑不同机房)

这种分配方式,保证了不同机房之间拥有全部的topic,一个机房的数据挂掉,仍然有另一个机房的数据可以使用。(前提条件,replica数目大于或等于机房的数目)

总结

kafka通过replica分配的算法保证了当某台机器挂掉,甚至某个机房挂掉,依然有备份可用。这种分配备份的算法,可以套用在需要有备份的场景,比如hdfs(没研究过,不知道是不是一样的)。

参考资料

https://community.hortonworks.com/questions/71458/can-anyone-explain-kafka-rack-awareness-feature.html
kafka源码 kafka.admin.AdminUtils#assignReplicasToBrokers

目录
相关文章
|
2月前
|
消息中间件 运维 监控
深入解析Kafka中Replica的妙用
深入解析Kafka中Replica的妙用
122 0
|
2月前
|
消息中间件 存储 数据可视化
kafka高可用集群搭建
kafka高可用集群搭建
87 0
|
3天前
|
消息中间件 算法 NoSQL
Kafka如何保证系统的可用性 Replica副本的作用
Kafka如何保证系统的可用性 Replica副本的作用
7 0
|
28天前
|
消息中间件 Kafka 程序员
Kafka面试必备:深度解析Replica副本的作用与机制
**Kafka的Replica副本是保证数据可靠性的关键机制。每个Partition有Leader和Follower副本,Leader处理读写请求及管理同步,Follower被动同步并准备成为新Leader。从Kafka 2.4开始,Follower在完全同步时也可提供读服务,提升性能。数据一致性通过高水位机制和Leader Epoch机制保证,后者更精确地判断和恢复数据一致性,增强系统容错能力。**
34 1
|
19天前
|
消息中间件 算法 Kafka
从零开始掌握Kafka Rebalance和分区分配
**Kafka Rebalance详解:**当消费者组成员、订阅主题或分区变化时,集群需重新分配任务。涉及关键点:成员增减、主题数量及分区数变更。Rebalance包括Leader选举、RangeAssignor算法的分区分配,以及创建、删除、修改和查询Topic的基本操作。了解这些有助于优化Kafka集群管理。关注“软件求生”获取更多技术内容!
18 0
|
24天前
|
消息中间件 负载均衡 监控
基于kafka项目之Keepalived高可用详细介绍
基于kafka项目之Keepalived高可用详细介绍
|
1月前
|
消息中间件 监控 大数据
揭秘Kafka:大数据和流计算领域的高可用利器
**Kafka是分布式流处理平台,以高效、可伸缩和消息持久化著称。其高可用性通过分区和副本机制实现:每个分区有Leader和Follower副本,Leader处理请求,Follower同步数据。当Leader故障时,ZooKeeper协助选举新Leader,确保服务连续。Kafka适用于大数据处理、流计算和日志分析,但异步处理可能导致延迟,不适合极高实时性场景,并且管理和配置复杂。**
55 0
|
2月前
|
消息中间件 存储 Kafka
【Kafka】Replica、Leader 和 Follower 三者的概念分析
【4月更文挑战第11天】【Kafka】Replica、Leader 和 Follower 三者的概念分析
|
2月前
|
消息中间件 存储 负载均衡
【Kafka】Replica 的重要性
【4月更文挑战第11天】【Kafka】Replica 的重要性
|
2月前
|
消息中间件 存储 Kafka
Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
【2月更文挑战第19天】Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
163 1

热门文章

最新文章