备案控制台

开发者社区微服务文章正文

死磕-kafka(二）

2024-09-25 35

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 死磕-kafka(二）

一、为什么需要kafka

①、kafka起源于LinkedIn公司，LinkedIn需要收集各个业务系统和应用的指标数据来进行数据分析。

②、原先是使用"自定义开发"系统来实现的，但是需要采集的数据量非常大的，且内容很复杂，而且除了采集系统的基础指标（内存，CPU,磁盘，网络等）外，还要采集很多和业务相关的数据指标。

③、而且随着数据量的增长，业务的需求的复杂度增高，这个自定义开发的系统的问题也越来越多。

例如：一个HTTP请求过来，如果数据内容是XML数据格式进行传输的话，需要先对这部分数据做解析处理，然后才能拿来做离线分析。

但是解析XML数据格式的解析过程也是非常复杂的，出现问题，定位也非常麻烦，需要很长的处理时间，所以说无法做到实时服务。

④、之后这家公司寻找了一个可支持大数据并且实时服务而且支持水平扩展的解决方案，尝试用过ActiveMQ,但是它不支持水平扩展，并且ActiveMQ内部有很多的bug。

⑤、然后这个公司就自己开发了一个既满足实时处理需求，又可以支持水平扩展的消息系统-kafka，它还拥有高吞吐量特性。

⑥、2010年，kafka项目被托管到Github的开源社区，2021年，kafka成为Apache 项目基金会的一个开源项目，如今,kafka项目已经成为Apache项目基金会的顶级项目之一。

今天先到这了，明天见~~

文章标签：

云消息队列 Kafka 版

消息中间件

Kafka

数据格式

Apache

XML

1176112968452250

目录

相关文章

1176112968452250

|

4月前

|

消息中间件存储分布式计算

死磕-kafka(三)

死磕-kafka(三)

1176112968452250

51 2 2

爱敲代码的小黄

|

8月前

|

消息中间件存储 Kafka

阿里 P7 三面凉凉，kafka Borker 日志持久化没答上来

阿里 P7 三面凉凉，kafka Borker 日志持久化没答上来

爱敲代码的小黄

90 1 1

1176112968452250

|

4月前

|

消息中间件存储算法

死磕-kafka(二）

死磕-kafka(二）

1176112968452250

41 2 2

1176112968452250

|

4月前

|

消息中间件 Kafka 调度

死磕-kafka(一)

死磕-kafka(一)

1176112968452250

39 2 2

程序员飞鱼

|

3月前

|

消息中间件存储 Kafka

面试题：Kafka如何保证高可用？有图有真相

面试题：Kafka如何保证高可用？有图有真相

程序员飞鱼

87 0 0

阿里云开发者

|

8月前

|

消息中间件 Kafka API

这些年背过的面试题——Kafka篇

本文是技术人面试系列Kafka篇，面试中关于Kafka都需要了解哪些基础？一文带你详细了解，欢迎收藏！

阿里云开发者

242 0 0

大数据架构师

|

消息中间件存储大数据

为啥非要用Kafka？其他MQ不行么？ by 彭文华

为啥非要用Kafka？其他MQ不行么？ by 彭文华

大数据架构师

190 0 0

大数据启示录

|

消息中间件存储数据采集

kafka几道面试题

kafka几道面试题

大数据启示录

299 0 1

javaedge

|

消息中间件 Java Kafka

滴滴二面：Kafka是如何读写副本消息的？

无论是读取副本还是写入副本，都是通过底层的Partition对象完成的，而这些分区对象全部保存在上节课所学的allPartitions字段中。可以说，理解这些字段的用途，是后续我们探索副本管理器类功能的重要前提。

javaedge

143 0 0

auqbllxiu

|

消息中间件存储缓存

你能说出 Kafka 这些原理吗（一）

这是 Java 建设者的第 52 篇原创文章

auqbllxiu

109 0 0

你能说出 Kafka 这些原理吗（一）

热门文章

最新文章

securecrt克隆会话与sshd 的 MaxSessions

阿里云学生服务器优惠购买入口

GitHub 宣布正式收购 npm | 云原生生态周报 Vol. 42

“2016首届北森用户生态大会”携你探寻人才管理的新生态

贵州邮政：IMO班聊让内部沟通信息跳涨10万+

Android的界面设计工具 DroidDraw

使用Android Studio创建第一个Hello World应用程序

C# 结构（很少能用到）

[BoUML]生成代码

Tsung: A open-source, multi-protocol, distributed load testing tool

《探寻开源AI项目的资金密码：可持续运营之路》

《开源数据：点燃人工智能在自然语言处理与计算机视觉领域的突破引擎》

《开源算法：人工智能领域的双刃剑》

《深度剖析：开源与闭源模型，AI舞台上的不同角色》

《解锁数据新动能：数据标注工具与AI模型训练平台的无缝对接热潮》

为了提升运维工程师及开发者

吴恩达2024 AI总结 | AI大咖说

招行面试：高并发写，为什么不推荐关系数据？

基于QLearning强化学习的较大规模栅格地图机器人路径规划matlab仿真

《docker基础篇：6.本地镜像发布到私有库》包括本地镜像发布到私有库流程、docker regisry是什么、将本地镜像推送到私有库

相关电子书

更多

Redis主题交流

低代码开发师（初级）实战教程

阿里巴巴DevOps 最佳实践手册

下一篇

DataWorks智能交互式数据开发与分析之旅