备案控制台

开发者社区微服务文章正文

死磕-kafka(二）

2024-09-25 63

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 死磕-kafka(二）

一、为什么需要kafka

①、kafka起源于LinkedIn公司，LinkedIn需要收集各个业务系统和应用的指标数据来进行数据分析。

②、原先是使用"自定义开发"系统来实现的，但是需要采集的数据量非常大的，且内容很复杂，而且除了采集系统的基础指标（内存，CPU,磁盘，网络等）外，还要采集很多和业务相关的数据指标。

③、而且随着数据量的增长，业务的需求的复杂度增高，这个自定义开发的系统的问题也越来越多。

例如：一个HTTP请求过来，如果数据内容是XML数据格式进行传输的话，需要先对这部分数据做解析处理，然后才能拿来做离线分析。

但是解析XML数据格式的解析过程也是非常复杂的，出现问题，定位也非常麻烦，需要很长的处理时间，所以说无法做到实时服务。

④、之后这家公司寻找了一个可支持大数据并且实时服务而且支持水平扩展的解决方案，尝试用过ActiveMQ,但是它不支持水平扩展，并且ActiveMQ内部有很多的bug。

⑤、然后这个公司就自己开发了一个既满足实时处理需求，又可以支持水平扩展的消息系统-kafka，它还拥有高吞吐量特性。

⑥、2010年，kafka项目被托管到Github的开源社区，2021年，kafka成为Apache 项目基金会的一个开源项目，如今,kafka项目已经成为Apache项目基金会的顶级项目之一。

今天先到这了，明天见~~

文章标签：

云消息队列 Kafka 版

消息中间件

Kafka

数据格式

Apache

XML

1176112968452250

目录

相关文章

wljslmz

|

并行计算调度 C++

探索C++中的多线程编程：从基础到高级

【4月更文挑战第20天】

wljslmz

289 1 1

探索C++中的多线程编程：从基础到高级

想飞的雪糕

|

存储 JavaScript 数据库

ToB项目身份认证AD集成（一）：基于目录的用户管理、LDAP和Active Directory简述

本文介绍了基于目录的用户管理及其在企业中的应用，重点解析了LDAP协议和Active Directory服务的概念、关系及差异。通过具体的账号密码认证时序图，展示了利用LDAP协议与AD域进行用户认证的过程。总结了目录服务在现代网络环境中的重要性，并预告了后续的深入文章。

想飞的雪糕

539 2 3

DreamSpark

|

Rust 网络协议安全

Rust在系统编程中的案例分享

Rust在系统编程中的案例分享

DreamSpark

252 10 10

武子康

|

消息中间件监控 Ubuntu

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

武子康

389 3 3

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

BetterBench

|

机器学习/深度学习 Linux TensorFlow

【Tensorflow+keras】用代码给神经网络结构绘图

文章提供了使用TensorFlow和Keras来绘制神经网络结构图的方法，并给出了具体的代码示例。

BetterBench

309 0 1

武子康

|

消息中间件存储 Java

大数据-58 Kafka 高级特性消息发送02-自定义序列化器、自定义分区器 Java代码实现

大数据-58 Kafka 高级特性消息发送02-自定义序列化器、自定义分区器 Java代码实现

武子康

241 3 3

武子康

|

消息中间件缓存大数据

大数据-57 Kafka 高级特性消息发送相关01-基本流程与原理剖析

大数据-57 Kafka 高级特性消息发送相关01-基本流程与原理剖析

武子康

163 3 3

武子康

|

消息中间件 SQL 分布式计算

大数据-76 Kafka 高级特性稳定性-消费重复生产者、Broker、消费者导致的重复消费问题

大数据-76 Kafka 高级特性稳定性-消费重复生产者、Broker、消费者导致的重复消费问题

武子康

162 1 1

朝阳39

解除谷歌浏览器默认禁止音频自动播放

解除谷歌浏览器默认禁止音频自动播放

朝阳39

201 1 1

1941623231718325

|

开发框架持续交付项目管理

敏捷项目管理：Scrum框架详解

【8月更文挑战第19天】Scrum作为一种轻量级、灵活的敏捷开发框架，为软件开发项目提供了一种高效、灵活的管理方式。通过明确的核心概念、角色、活动和工件，Scrum帮助团队快速响应变化、持续交付价值，并提升团队协作和自组织能力。然而，成功实施Scrum也面临一些挑战，如沟通成本、文档缺失以及技能要求等。因此，在采用Scrum框架时，团队需要充分准备，确保成员具备必要的技能和态度，以充分发挥Scrum的优势，实现项目的成功。

1941623231718325

622 2 2

热门文章

最新文章

linux下ffmpeg安装

overleaf 插入图片，引用图片，图标标题Fig与文章引用Figure不一致解决

364 页 PyTorch 版《动手学深度学习》PDF 开源了（全中文，支持 Jupyter 运行）

阿里云上的几种数据备份方式

用深度神经网络修复H漫：看完这篇你就能眼中无码

MySQL · 引擎特性 · 像NOSQL那样使用MySQL

解决GitHub文件无法下载的问题

OpenSearch大模型实践之Havenask篇

SpringBoot整合Java Mail实现Outlook / Office365发送邮件

2019阿里云双11来袭,价格非常重要,但是懂得上云攻略更重要

AI Agent：从工具到伙伴的智能进化

计算机网络--TCP和UDP学习

LBA-ECO ND-30 营养分析和气体通量，森林年代序列，巴西帕拉州

2025年测试工程师的核心能力：掌握Dify工作流编排AI测试智能体

有了解过 SpringBoot 的参数配置吗？

分类模型校准：ROC-AUC不够？用ECE/pMAD评估概率质量

把服务器当代码写：IaC 让部署变得又稳又香

SDN 和 NFV：把网络“拆开重做”的底层革命，到底牛在哪？

用数据“掘地三尺”，为零碳排放找出一条最靠谱的路

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云弹性公网IP线路类型【BGP(多线)_精品】是什么意思？