Kafka高可用——replica分配方式

简介: Kafka的Replica概念kafka的replica指的是消息的备份,为了保证kafka的高可用(当leader节点挂了之后,kafka依然能提供服务)kafka提供了备份的功能。

Kafka的Replica

概念

kafka的replica指的是消息的备份,为了保证kafka的高可用(当leader节点挂了之后,kafka依然能提供服务)kafka提供了备份的功能。这个备份是针对partition的。

可以通过 default.replication.factor 对replica的数目进行配置,默认值为1,表示不对topic进行备份。如果配置为2,表示除了leader节点,对于topic里的每一个partition,都会有一个额外的备份。

replica分配

为了起到备份的效果,简单设想下,如果让我们来分配replica,我们会怎么分配?
1)replica与所备份的节点不能再一台机器上,否则就起不到备份的效果
2)replica尽量均匀的分布在集群机器上,如果replica全部都在某几台机器上,那么一旦这台机器挂了,会丢失多个partition的备份

假设有3个broker、一个topic1、topic1有3个partition,default.replication.factor被设置为2,可能会这样分配


img_7654f69f203c098f49c7054dc84fc1b9.png
简单的replica分配示意图(圆角矩形代表replica)

这种分配保证了,任何一台机器挂掉,kafka集群依然有备份可用。

replica分配算法

假设有5个broker,10个partitions,备份数设置为3

1、从一个集群的随机节点开始,轮询放置第一个replica

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0 p1 p2 p3 p4 1st replica
p5 p6 p7 p8 p9 1st replica

2、后面的replica增加一个偏移量,继续放置,比如这里的p0,从broker-0开始,下一个replica就从broker-1开始

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0(start) p1 p2 p3 p4 1st replica
p5(start) p6 p7 p8 p9 1st replica
p4 p0 (start) p1 p2 p3 2nd replica
p8 p9 p5(start) p6 p7 2nd replica
p3 p4 p0(start) p1 p2 3rd replica
p7 p8 p9 p5(start) p6 3rd replica

通过这种方式,replica尽可能的被均匀分配在多个broker上

多机房

上述方法,可以保证多个broker存在时,哪怕其中一个broker挂了,kafka依旧能提供服务。但是,当有多个机房时候,这种分配方式,不能保证,跨机房的高可用。

示例:4个broker,4个partition,每个partition有1个备份

img_02396440feae6ac94803a752265ab54a.png
备份(不考虑机房)

按照之前的算法,replica会按照上图所示设置备份。这样假设机房1因为某个原因挂掉了, partition0的数据就会丢失掉。同理,机房2挂了,partition2也会丢失掉。

replica分配算法考虑机房

kafka可以配置一个参数broker.rack说明当前broker在哪个机房。

如上图,配置
broker0 -> rack1
broker1 -> rack1
broker2 -> rack2
broker3 -> rack2

当进行replica排序时候,不会仅仅按照broker顺序进行排序,而是会保证机房错开。比如这种情况的排序可能是
broker0,broker2,broker1,broker3

这样子排序之后,再次按照上述replica分配算法分配。


img_c9baefe5fd0283d3d189d26558ba664d.png
replica分配(考虑不同机房)

这种分配方式,保证了不同机房之间拥有全部的topic,一个机房的数据挂掉,仍然有另一个机房的数据可以使用。(前提条件,replica数目大于或等于机房的数目)

总结

kafka通过replica分配的算法保证了当某台机器挂掉,甚至某个机房挂掉,依然有备份可用。这种分配备份的算法,可以套用在需要有备份的场景,比如hdfs(没研究过,不知道是不是一样的)。

参考资料

https://community.hortonworks.com/questions/71458/can-anyone-explain-kafka-rack-awareness-feature.html
kafka源码 kafka.admin.AdminUtils#assignReplicasToBrokers

目录
相关文章
|
7月前
|
消息中间件 运维 监控
深入解析Kafka中Replica的妙用
深入解析Kafka中Replica的妙用
358 0
|
7月前
|
消息中间件 存储 数据可视化
kafka高可用集群搭建
kafka高可用集群搭建
140 0
|
2月前
|
消息中间件 SQL 分布式计算
大数据-64 Kafka 高级特性 分区Partition 分区重新分配 实机实测重分配
大数据-64 Kafka 高级特性 分区Partition 分区重新分配 实机实测重分配
109 7
|
4月前
|
消息中间件 负载均衡 Kafka
Kafka分区分配策略大揭秘:RoundRobin、Range、Sticky,你真的了解它们吗?
【8月更文挑战第24天】Kafka是一款突出高吞吐量、可扩展性和数据持久性的分布式流处理平台。其核心特性之一是分区分配策略,对于实现系统的负载均衡和高可用性至关重要。Kafka支持三种主要的分区分配策略:RoundRobin(轮询)、Range(范围)和Sticky(粘性)。RoundRobin策略通过轮询方式均衡分配分区;Range策略根据主题分区数和消费者数量分配;而Sticky策略则在保持原有分配的基础上动态调整,以确保各消费者负载均衡。理解这些策略有助于优化Kafka性能并满足不同业务场景需求。
347 59
|
2月前
|
消息中间件 分布式计算 算法
大数据-67 Kafka 高级特性 分区 分配策略 Ranger、RoundRobin、Sticky、自定义分区器
大数据-67 Kafka 高级特性 分区 分配策略 Ranger、RoundRobin、Sticky、自定义分区器
54 3
|
2月前
|
消息中间件 存储 Kafka
面试题:Kafka如何保证高可用?有图有真相
面试题:Kafka如何保证高可用?有图有真相
|
5月前
|
消息中间件 负载均衡 Kafka
微服务数据问题之Kafka实现高可用如何解决
微服务数据问题之Kafka实现高可用如何解决
|
6月前
|
消息中间件 Kafka 程序员
Kafka面试必备:深度解析Replica副本的作用与机制
**Kafka的Replica副本是保证数据可靠性的关键机制。每个Partition有Leader和Follower副本,Leader处理读写请求及管理同步,Follower被动同步并准备成为新Leader。从Kafka 2.4开始,Follower在完全同步时也可提供读服务,提升性能。数据一致性通过高水位机制和Leader Epoch机制保证,后者更精确地判断和恢复数据一致性,增强系统容错能力。**
244 1
|
5月前
|
消息中间件 算法 NoSQL
面试题Kafka问题之Kafka保证系统的可用性如何解决
面试题Kafka问题之Kafka保证系统的可用性如何解决
50 0
|
5月前
|
消息中间件 算法 Kafka
从零开始掌握Kafka Rebalance和分区分配
**Kafka Rebalance详解:**当消费者组成员、订阅主题或分区变化时,集群需重新分配任务。涉及关键点:成员增减、主题数量及分区数变更。Rebalance包括Leader选举、RangeAssignor算法的分区分配,以及创建、删除、修改和查询Topic的基本操作。了解这些有助于优化Kafka集群管理。关注“软件求生”获取更多技术内容!
262 0
下一篇
DataWorks