备案控制台

开发者社区问答正文

Kafka存储机制是什么？

Kafka存储机制是什么？

展开

收起

三分钟热度的鱼 2024-04-18 14:32:14 130 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

Kafka和MetaQ一样，都是采用topic作为发布和订阅的主题，topic是个逻辑概念，而partition是物理上面的概念，每个partition对应一个log文件，该log文件中存储的就是producer生产的数据。producer生产的数据会被不断追加到log文件的末端，且每条数据都有自己的offset。
每个Partition都会有自己的副本，Kafka会尽量的使所有的分区均匀的分布到集群中的所有节点而不是集中在某些节点上，另外主从关系也尽量均衡这样每个几点都会担任一定比例的分区的leader。
每个partition以目录的形式存储在broker上，该目录底下存储着的是该partition内容被平均分配成的多个大小相等的数据文件，我们称之为segment(段)。每个segment文件分为两个部分，index file和data file，此两个文件一一对应，后缀".index"和".log"分别表示segment的索引文件和数据文件。文件的命名规则为partition全局的第一个segment为0开始，后续每个segment文件名为上一个全局partion的最大offset(偏移message数)。每个segment中存储很多条消息，消息id由其逻辑位置决定，即从消息id可直接定位到消息的存储位置，避免id到位置的额外映射。
segment index file采取稀疏索引存储方式，它减少索引文件大小，通过mmap可以直接内存操作，稀疏索引为数据文件的每个对应message设置一个元数据指针,先通过index文件中获取该message的一个位置范围，然后根据这个位置范围在log文件中找到该message的信息。

2024-04-18 14:45:00

赞同 1 展开评论

问答分类：

消息中间件 Kafka 存储云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版存储云消息队列 Kafka 版机制

问答地址：

开发者社区 > 微服务 > 问答

相关问答

如何查看消息队列Kafka版Topic的磁盘存储使用量

283

1

0

消息队列Kafka版标准版实例无法创建local存储的topic

104

1

0

消息队列Kafka版云存储和Local存储有什么区别

74

1

0

DataWorks数据集成任务kafka任务同步的话，怎么筛选事件时间进行存储？

198

1

0

使用 Kafka 作为中间层存储时，遇到了哪些主要问题？

78

1

0

Flink的mysql同步kafka 目前只能是kafka存储所有数据的么？

102

1

0

消息队列Kafka版自动创建Topic能否默认local存储

93

1

0

Kafka中的partition是如何存储在broker上的？

102

1

0

Kafka中producer生产的数据是如何存储在partition中的？

93

1

0

请问flinkcdc中，upser-kafka会一直存储在kafka里面，攒着内存那kafka不会？

166

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

上传文件时提示“Illegal file path”，怎么解决的？

阿里云ESA是什么？边缘安全加速和CDN有什么区别？

个人非公司，可以使用阿里云短信群发平台吗？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

相关文章

腾讯新闻 item_search - 热榜数据接口对接全攻略：从入门到精通

工业互联网数据安全专项行动启动三年实现核心企业防护全覆盖 - 金海境科技

基于反馈循环的自我进化AI智能体：原理、架构与代码实现

数据建模到底怎么稳？从维度建模聊到列式存储，让你的数据仓库飞起来！

别等系统报警了才想起 Trace！——分布式事务可观测性的那些坑与优化套路

还有其他疑问?