大数据开发岗大厂面试30天冲刺 - 日积月累,每日五题【Day04】——Kafka2

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 大数据开发岗大厂面试30天冲刺 - 日积月累,每日五题【Day04】——Kafka2

面试题 01 Kafka中消费者与消费者组的关系是什么?

•消费者组负责订阅Topic,消费者负责消费Topic分区的数据

•消费者组中可以包含多个消费者,多个消费者共同消费数据,增加消费并行度,提高消费性能

•消费者组的id由开发者指定,消费者的id由Kafka自动分配

面试题02、Kafka中Topic和Partition是什么,如何保证Partition数据安全?

Topic:逻辑上实现数据存储的分类,类似于数据库中的表概念

Partition:Topic中用于实现分布式存储的物理单元,一个Topic可以有多个分区

–每个分区可以存储在不同的节点,实现分布式存储

•保证数据安全通过副本机制:Kafka中每个分区可以构建多个副本【副本个数 <= 机器的个数】

–将一个分区的多个副本分为两种角色

leader副本:负责对外提供读写请求

follower副本:负责与leader同步数据,如果leader故障,follower要重新选举一个成为leader

选举:由Kafka Crontroller来决定谁是leader

面试题 03 Kafka中的Segment是什么?

•Segment是对分区内部的数据进行更细的划分,分区段,文件段

规则:按照文件产生的时间或者大小

目的:提高写入和查询性能

–文件名称可以用于检索数据:用offset命名的

组成:每个Segment由两个文件组成

–.log:存储的数据

–.index:对应.log文件的索引信息

面试题04、Kafka中的Offset是什么?

•Offset是kafka中存储数据时给每个数据做的标记或者编号

•分区级别的编号,每个分区从0开始编号

功能:消费者根据offset来进行消费,保证顺序消费以及消费数据的一次性语义

面试题05、请简述如何使用Kafka Simple Java API 实现数据生产?描述具体的类及方法

•step1:构建生产者连接对象:KafkaProducer

–需要配置对象:管理配置,例如连接地址:Properties

•step2:KafkaProducer:send:生产数据到Kafka中

–需要构建一个生产的数据对象:ProducerRecord

–ProducerRecord(Topic,Value)

–ProducerRecord(Topic,Key,Value)

–ProducerRecord(Topic,Partition,Key,Value)

总结

今天我们复习了面试中常考的Kakfa相关的五个问题,你做到心中有数了么?

其实做这个专栏我也有私心,就是希望借助每天写一篇面试题,督促自己学习,以免在吹水群甚至都没有谈资!

对了,如果你的朋友也在准备面试,请将这个系列扔给他,

好了,今天就到这里,学废了的同学,记得在评论区留言:打卡。给同学们以激励。


目录
相关文章
|
1月前
|
消息中间件 存储 缓存
大厂面试高频:Kafka 工作原理 ( 详细图解 )
本文详细解析了 Kafka 的核心架构和实现原理,消息中间件是亿级互联网架构的基石,大厂面试高频,非常重要,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:Kafka 工作原理 ( 详细图解 )
|
2月前
|
消息中间件 关系型数据库 MySQL
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
184 0
|
2月前
|
消息中间件 分布式计算 NoSQL
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
45 0
|
1月前
|
消息中间件 大数据 Kafka
大厂面试高频:Kafka、RocketMQ、RabbitMQ 的优劣势比较
本文深入探讨了消息队列的核心概念、应用场景及Kafka、RocketMQ、RabbitMQ的优劣势比较,大厂面试高频,必知必会,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:Kafka、RocketMQ、RabbitMQ 的优劣势比较
|
2月前
|
消息中间件 存储 缓存
美团面试: Kafka为啥能实现 10Wtps 到100Wtps ?kafka 如何实现零复制 Zero-copy?
40岁老架构师尼恩分享了Kafka如何实现高性能的秘诀,包括零拷贝技术和顺序写。Kafka采用mmap和sendfile两种零拷贝技术,前者用于读写索引文件,后者用于向消费者发送消息,减少数据在用户空间和内核空间间的拷贝次数,提高数据传输效率。此外,Kafka通过顺序写日志文件,避免了磁盘寻道和旋转延迟,进一步提升了写入性能。尼恩还提供了系列技术文章和PDF资料,帮助读者深入理解这些技术,提升面试竞争力。
美团面试: Kafka为啥能实现 10Wtps 到100Wtps ?kafka 如何实现零复制 Zero-copy?
|
2月前
|
消息中间件 存储 druid
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
48 3
|
2月前
|
消息中间件 druid 大数据
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(二)
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(二)
40 2
|
2月前
|
消息中间件 分布式计算 druid
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(一)
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(一)
60 1
|
2月前
|
消息中间件 存储 前端开发
资深Android开发的5个经典面试题
本文首发于公众号“AntDream”,欢迎关注。文章详细解答了五个常见的Android面试题,涵盖内存泄漏与溢出、Binder机制、MVC/MVP/MVVM架构、Handler机制及Context对象等内容,帮助读者深入了解Android开发的核心概念。
41 0
|
2月前
|
消息中间件 存储 Kafka
面试题:Kafka如何保证高可用?有图有真相
面试题:Kafka如何保证高可用?有图有真相
下一篇
DataWorks