文档备案控制台

开发者社区冰河技术文章正文

面试必问 | 聊聊Kafka的消费模型？

2021-12-31 545

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 面试必问 | 聊聊Kafka的消费模型？

大家好，我是冰河~~

最近，有些读者去头条二面，被面试官问了一个关于Kafka的问题：多个Kafka消费者如何同时消费相同Topic下的相同Partition的数据？ 看似一个简单的问题，竟然把这位读者问懵了！

今天，我们就一起来说说这个面试题，好了，开始今天的主题。

题目分析

首先，要明确面试官的问题：多个Kafka消费者如何同时消费相同Topic下的相同Partition的数据？ 这个问题问的已经很明显了，我们只要回答出如何让多个Kafka消费者同时消费相同Topic下的相同Partition的数据就可以了。

为了能够回答好这个问题，我们需要理解Kafka中的一个概念，就是 消费者组（Consumer Group）。消费者组是Kafka实现单播和广播两种消息模型的基础和手段。

对于同一个Topic（主题）来说，每个消费者组都可以拿到这个Topic中的全部数据。消费者组内的所有消费者协调在一起来订阅并消费Kafka Topic中的所有分区。这里，每个分区只能由同一个消费者组内的一个消费者来消费。

这里，为了更好的理解，我们简单的画一张Kafka消费消息的原理图，如下所示。

在这张图中，一个主题可以配置几个分区，生产者发送的消息分发到不同的分区中，消费者接收数据的时候是按照消费者组来接收的，Kafka确保每个分区的消息只能被同一个消费者组中的同一个消费者消费。

如果想要重复消费，那么需要其他的消费者组来消费。Zookeerper中保存每个主题下的每个分区在每个消费者组中消费的offset。

新版kafka把这个offset保存到了一个__consumer_offsert的主题下。这个__consumer_offsert有50个分区，通过将消费者组的id哈希值%50的值来确定要保存到那一个分区。这样也是为了考虑到Zookeeper不擅长大量数据读写的原因。

所以，如果要一个消费者组用几个消费者来同时消费Kafka中消息的话，可以使用多线程来读取消息，一个线程相当于一个消费者实例。当消费者的数量大于分区的数量时，有些消费者线程会读取不到数据。

扩展知识

这里，我们举一个例子：假设一个主题 testTopic 被groupA消费了，现在启动另外一个新的groupB来消费testTopic，默认testTopic-groupB的Offset不是0，而是在Kafka中还没有建立这样的一个Offset。

除非当testTopic 主题有数据的时候，groupB会收到该数据，该条数据也是第一条数据，此时，groupB的Offset并不是从0开始的，而是从刚初始化的Offset开始的, 除非显式的用–from-beginning 来获取从0开始的数据。

题目解答

多个Kafka消费者要想同时消费相同Topic下的相同Partition的数据，则需要将这些Kafka消费者放到不同的消费者组中。

文章标签：

云消息队列 Kafka 版

消息中间件

Kafka

关键词：

面试云消息队列 Kafka 版

面试模型

云消息队列 Kafka 版面试

云消息队列 Kafka 版模型

云消息队列 Kafka 版消费

技术小达人

目录

相关文章

mikechen的互联网架构

|

消息中间件存储缓存

大厂面试高频：Kafka 工作原理（详细图解）

本文详细解析了 Kafka 的核心架构和实现原理，消息中间件是亿级互联网架构的基石，大厂面试高频，非常重要，建议收藏。关注【mikechen的互联网架构】，10年+BAT架构经验倾囊相授。

mikechen的互联网架构

1704 16 16

大厂面试高频：Kafka 工作原理（详细图解）

技术自由圈/原疯狂创客圈

|

消息中间件架构师 Java

美团面试：对比分析 RocketMQ、Kafka、RabbitMQ 三大MQ常见问题？

美团面试：对比分析 RocketMQ、Kafka、RabbitMQ 三大MQ常见问题？

技术自由圈/原疯狂创客圈

2798 22 22

美团面试：对比分析 RocketMQ、Kafka、RabbitMQ 三大MQ常见问题？

技术自由圈/原疯狂创客圈

|

消息中间件运维 Java

招行面试：RocketMQ、Kafka、RabbitMQ，如何选型？

45岁资深架构师尼恩针对一线互联网企业面试题，特别是招商银行的高阶Java后端面试题，进行了系统化梳理。本文重点讲解如何根据应用场景选择合适的消息中间件（如RabbitMQ、RocketMQ和Kafka），并对比三者的性能、功能、可靠性和运维复杂度，帮助求职者在面试中充分展示技术实力，实现“offer直提”。此外，尼恩还提供了《尼恩Java面试宝典PDF》等资源，助力求职者提升架构、设计、开发水平，应对高并发、分布式系统的挑战。更多内容及技术圣经系列PDF，请关注【技术自由圈】获取。

技术自由圈/原疯狂创客圈

1254 8 8

mikechen的互联网架构

|

消息中间件大数据 Kafka

大厂面试高频：Kafka、RocketMQ、RabbitMQ 的优劣势比较

本文深入探讨了消息队列的核心概念、应用场景及Kafka、RocketMQ、RabbitMQ的优劣势比较，大厂面试高频，必知必会，建议收藏。关注【mikechen的互联网架构】，10年+BAT架构经验倾囊相授。

mikechen的互联网架构

1529 0 1

大厂面试高频：Kafka、RocketMQ、RabbitMQ 的优劣势比较

土木林森

|

存储网络协议安全

30 道初级网络工程师面试题，涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术，帮助小白们充分准备面试，顺利踏入职场

本文精选了 30 道初级网络工程师面试题，涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术，帮助小白们充分准备面试，顺利踏入职场。

土木林森

2445 2 3

qhhf_地道酬勤

|

网络协议算法网络性能优化

计算机网络常见面试题（一）：TCP/IP五层模型、TCP三次握手、四次挥手，TCP传输可靠性保障、ARQ协议

计算机网络常见面试题（一）：TCP/IP五层模型、应用层常见的协议、TCP与UDP的区别，TCP三次握手、四次挥手，TCP传输可靠性保障、ARQ协议、ARP协议

qhhf_地道酬勤

728 2 2

技术自由圈/原疯狂创客圈

|

消息中间件存储缓存

美团面试： Kafka为啥能实现 10Wtps 到100Wtps ？kafka 如何实现零复制 Zero-copy？

40岁老架构师尼恩分享了Kafka如何实现高性能的秘诀，包括零拷贝技术和顺序写。Kafka采用mmap和sendfile两种零拷贝技术，前者用于读写索引文件，后者用于向消费者发送消息，减少数据在用户空间和内核空间间的拷贝次数，提高数据传输效率。此外，Kafka通过顺序写日志文件，避免了磁盘寻道和旋转延迟，进一步提升了写入性能。尼恩还提供了系列技术文章和PDF资料，帮助读者深入理解这些技术，提升面试竞争力。

技术自由圈/原疯狂创客圈

721 0 0

美团面试： Kafka为啥能实现 10Wtps 到100Wtps ？kafka 如何实现零复制 Zero-copy？

程序员飞鱼

|

消息中间件存储 Kafka

面试题：Kafka如何保证高可用？有图有真相

面试题：Kafka如何保证高可用？有图有真相

程序员飞鱼

463 0 0

热爱技术的小郑

|

存储 Java

【IO面试题四】、介绍一下Java的序列化与反序列化

Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输，之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。

热爱技术的小郑

478 2 2

mikechen的互联网架构

|

存储算法 Java

大厂面试高频：什么是自旋锁？Java 实现自旋锁的原理？

本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】，10年+BAT架构经验倾囊相授。

mikechen的互联网架构

1632 6 6

大厂面试高频：什么是自旋锁？Java 实现自旋锁的原理？

热门文章

最新文章

骑士卡：基于Kafka搭建消息中心，上亿消息推送轻松完成

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

Kafka集群监控系统Kafka Eagle部署与体验

大数据-117 - Flink DataStream Sink 案例：写出到MySQL、写出到Kafka

docker安装kafka（wurstmeister）

Kafka Windows运行错误：创建消费者报错 consumer zookeeper is not a recognized option

查询Kafka生产者是否连接到Kafka服务

SIGMOD 2021《Kafka 流处理对一致性和完整性的设计》解读

步入未来科技前沿：全方位解读Unity在VR/AR开发中的应用技巧，带你轻松打造震撼人心的沉浸式虚拟现实与增强现实体验——附详细示例代码与实战指南

全面掌握Unity游戏开发核心技术：C#脚本编程从入门到精通——详解生命周期方法、事件处理与面向对象设计，助你打造高效稳定的互动娱乐体验

面试性能测试总被刷？学员真实遇到的高频问题全解析！

提供一些准备Java八股文面试的建议

Redis常见面试题全解析

C++面试周刊(3):面试不慌,这样回答指针与引用，青铜秒变王者

Python面试题精选及解析

字节面试： MySQL 百万级导入发生的 “死锁” 难题如何解决？“2序4拆”，彻底攻克

Redis数据类型面试给分情况

Java 面试实操指南与最新技术结合的实战攻略

MyBatis场景面试题

大厂RAG面试题：24个RAG八股文。偷偷背下来，毒打面试官！

相关课程

更多

消息队列Kafka入门课程

分布式消息系统 Kafka 快速入门

Java面试疑难点解析 - 面试技巧及语言基础

Java面试疑难点解析 - Java Web开发

Java面试疑难点解析 - 系统架构及项目设计

相关电子书

更多

阿里云技术面试红宝书

超全算法笔试-模拟题精解合集

程序员面试宝典

相关实验场景

更多

基于Flink+Kafka实现订单评论实时分析

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！