Kafka - 分区中各种偏移量的说明-阿里云开发者社区

Kafka - 分区中各种偏移量的说明

2023-10-19 660

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Kafka - 分区中各种偏移量的说明

引子

名词解释

Kafka是一个高性能、高吞吐量的分布式消息系统，被广泛应用于大数据领域。在Kafka中，分区是一个重要的概念，它可以将数据分发到不同的节点上，以实现负载均衡和高可用性。在分区中，有一些重要的偏移量指标，包括AR、ISR、OSR、HW和LEO。下面我们来详细解释一下这些指标的含义和作用。

1. AR（Assigned Replication）：

分区中的所有副本统称为AR（Assigned Replicas）

2. ISR（In-Sync Replicas）：同步副本集合

ISR是指当前与主副本保持同步的副本集合。当主副本发生故障时，Kafka会从ISR中选举一个新的主副本来接管工作。因此，ISR的大小对于分区的可用性和性能至关重要。如果ISR太小，那么当主副本故障时，选举新的主副本可能会导致数据丢失或延迟；如果ISR太大，那么同步数据的成本会变得很高，影响分区的性能。

3. OSR（Out-of-Sync Replicas）：异步副本集合

OSR是指当前与主副本不保持同步的副本集合。这些副本可能由于网络故障或其他原因而与主副本失去同步。OSR的存在不会影响分区的可用性和性能，但是如果OSR过大，那么可能会占用过多的磁盘空间和网络带宽。

4. HW（High Watermark）：高水位

HW是指已经被所有副本复制的最高偏移量。当消费者从分区中读取消息时，它会记录当前已经读取到的偏移量，并将该偏移量作为下一次读取的起始位置。如果消费者读取到的偏移量小于HW，那么它只能读取到已经被所有副本复制的消息；如果消费者读取到的偏移量大于HW，那么它可能会读取到未被所有副本复制的消息。

5. LEO（Log End Offset）：日志末尾偏移量

LEO是指分区中最后一条消息的偏移量。当生产者向分区中写入消息时，它会将该消息的偏移量记录在LEO中。消费者从分区中读取消息时，它可以通过LEO来判断是否已经读取了所有的消息。

综上所述，AR、ISR、OSR、HW和LEO是Kafka中重要的分区偏移量指标，它们对于保证消息的可靠性、持久性、可用性和性能至关重要。在使用Kafka时，我们需要充分理解这些指标的含义和作用，并根据实际情况来设置适当的参数值。

分区中各种偏移量的说明

分区中的所有副本统称为AR（Assigned Replicas）。

所有与leader副本保持一定程度同步的副本（包括leader副本在内）组成ISR（In-Sync Replicas），ISR集合是AR集合中的一个子集。消息会先发送到leader副本，然后follower副本才能从leader副本中拉取消息进行同步，同步期间内follower副本相对于leader副本而言会有一定程度的滞后。前面所说的“一定程度的同步”是指可忍受的滞后范围，这个范围可以通过参数进行配置。
与leader副本同步滞后过多的副本（不包括leader副本）组成OSR（Out-of-Sync Replicas），由此可见，AR=ISR+OSR。在正常情况下，所有的 follower 副本都应该与 leader 副本保持一定程度的同步，即 AR=ISR，OSR集合为空。
leader副本负责维护和跟踪ISR集合中所有follower副本的滞后状态，当follower副本落后太多或失效时，leader副本会把它从ISR集合中剔除。如果OSR集合中有follower副本“追上”了leader副本，那么leader副本会把它从OSR集合转移至ISR集合。
默认情况下，当leader副本发生故障时，只有在ISR集合中的副本才有资格被选举为新的leader，而在OSR集合中的副本则没有任何机会（不过这个原则也可以通过修改相应的参数配置来改变）。
ISR与HW和LEO也有紧密的关系。HW是High Watermark的缩写，俗称高水位，它标识了一个特定的消息偏移量（offset），消费者只能拉取到这个offset之前的消息。

如上图，它代表一个日志文件，这个日志文件中有 9 条消息，第一条消息的 offset（LogStartOffset）为0，最后一条消息的offset为8，offset为9的消息用虚线框表示，代表下一条待写入的消息。日志文件的HW为6，表示消费者只能拉取到offset在0至5之间的消息，而offset为6的消息对消费者而言是不可见的。

LEO是Log End Offset的缩写，它标识当前日志文件中下一条待写入消息的offset，上图中offset为9的位置即为当前日志文件的LEO，LEO的大小相当于当前日志分区中最后一条消息的offset值加1。分区ISR集合中的每个副本都会维护自身的LEO，而ISR集合中最小的LEO即为分区的HW，对消费者而言只能消费HW之前的消息。

很多资料中误将图中的offset为5的位置看作HW，而把offset为8的位置看作LEO，这显然是不对的。

Kafka - 分区中各种偏移量的说明

引子

名词解释

分区中各种偏移量的说明

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Kafka - 分区中各种偏移量的说明

引子

名词解释

分区中各种偏移量的说明

热门文章

最新文章

相关课程

相关电子书

相关实验场景