超详细:这份全网首发的Kafka技术手册,从基础到实战一应俱全

简介: Kafka正在爆炸式增长。超过三分之一的财富500强企业都使用Kafka。这些公司包括十大旅游公司,十大银行中的七家,十大保险公司中的八家,十大电信公司中的九家,以及更多。LinkedIn,微软和Netflix每天使用Kafka(1,000,000,000,000)处理万亿级的消息。Kafka用于实时数据流,收集大数据或进行实时分析(或两者兼而有之)。Kafka与内存微服务一起使用以提供可靠性,它可用于向 CEP(复杂事件流系统)和IoT / IFTTT式自动化系统提供事件。

网络异常,图片无法展示
|

什么是Kafka?

Kafka通常用于实时流数据架构,以提供实时分析。

Kafka正在爆炸式增长。超过三分之一的财富500强企业都使用Kafka。这些公司包括十大旅游公司,十大银行中的七家,十大保险公司中的八家,十大电信公司中的九家,以及更多。LinkedIn,微软和Netflix每天使用Kafka(1,000,000,000,000)处理万亿级的消息。Kafka用于实时数据流,收集大数据或进行实时分析(或两者兼而有之)。Kafka与内存微服务一起使用以提供可靠性,它可用于向 CEP(复杂事件流系统)和IoT / IFTTT式自动化系统提供事件。

为什么选择Kafka?

Kafka通常用于实时流式数据体系结构以提供实时分析。由于Kafka是一个快速,可扩展,耐用和容错的发布、订阅消息传递系统,Kafka被用于JMSRabbitMQAMQP可能因为数量和响应速度而不被考虑的情况。Kafka具有更高的吞吐量,可靠性和复制特性,使其适用于跟踪服务呼叫(跟踪每个呼叫)或跟踪传统MOM可能不被考虑的物联网传感器数据。

Who在使用Kafka?

许多处理大量数据的大公司使用Kafka。

  • LinkedIn起源于它,用它来跟踪活动数据和运营指标。
  • Twitter使用它作为Storm的一部分来提供流处理基础设施。
  • Square使用Kafka作为消息总线,将所有系统事件转移到各种Square数据中心(日志,自定义事件,度量标准等),输出到SplunkGraphite(仪表板)以及Esper-like / CEP警报系统。
  • Spotify,Uber,Tumbler,Goldman Sachs,PayPal,Box,Cisco,CloudFlare和Netflix等公司也使用这种方法。

由于整个笔记比较全面,内容相当的多 ,这里仅展示资料的一些截图,如有需要获取文中提到的 “Kafka技术手册” 的朋友 文末 有直达获取地址。

网络异常,图片无法展示
|

kafka知识导图

第一部分:初识Kafka

通过这一部分的学习,你可以学习一下内容:

  • 知道Kafka基本原理,了解关键术语概念
  • 可以使用Kafka进行消息系统开发
  • 通过Java语言来使用Kafka进行消息收发

内容涵盖:(特性 + 使用场景 + 技术优势 + 适应人群 + 概念详解 + 安装与配置 + Java第一个程序 + 服务端常用参数配置 + 总结

网络异常,图片无法展示
|

第二部分:生产者详解

通过这一部分的学习,你可以学习一下内容:

  • 深入学习Kafka数据生产大致流程
  • 如何创建并使用Kafka生产者
  • Kafka生产者常用配置

内容涵盖:(消息发送 + 发送原理剖析 + 其他生产者参数 + 总结

网络异常,图片无法展示
|

第三部分:消费者详解

通过这一部分的学习,你可以学习一下内容:

  • 深入学习Kafka数据消费大致流程
  • 如何创建并使用Kafka消费者
  • Kafka消费者常用配置

内容涵盖:(概念入门 + 消息接收 + 总结

网络异常,图片无法展示
|

第四部分:主题

通过这一部分的学习,你可以学习一下内容:

  • 深入学习Kafka主题的管理
  • KafkaAdminClient应用

内容涵盖:(管理 + 增加分区 + 分区副本的分配 + 其他主题参数配置 + KafkaAdminClient应用 + 总结

网络异常,图片无法展示
|

第五部分:分区

通过这一部分的学习,你可以学习一下内容:

  • 深入学习Kafka分区的管理
  • 包括:优先副本的选举、分区重新分配等

内容涵盖:(副本机制 + 分区Leader选举 + 分区重新分配 + 修改副本因子 + 分区分配策略 + 总结

网络异常,图片无法展示
|

第六部分:Kafka存储

通过这一部分的学习,你可以学习一下内容:

  • 在完成Kafka应用开发的基础上,知道文件存储机制
  • Kafka为什么使用磁盘作为存储介质
  • 分析文件存储格式
  • 快速检索消息

内容涵盖:(存储结构概述 + 日志索引 + 日志清理 + 磁盘存储优势 + 总结

网络异常,图片无法展示
|

第七部分:稳定性

通过这一部分的学习,你可以学习一下内容:

  • 深入学习Kafka在保证高性能、高吞吐的同时通过各种机制来保证高可用性

内容涵盖:(幂等性 + 事务 + 控制器 + 可靠性保证 + 一致性保证 + 消息重复的场景及解决方案 + __consumer_offsets + 总结

网络异常,图片无法展示
|

第八部分:高级应用

通过这一部分的学习,你可以学习一下内容:

  • 作为运维人员掌握命令行工具
  • 使用Connect进行流信息处理
  • 掌握延迟消息、流式处理等
  • Kafka和SpringBoot整合

内容涵盖:(命令行工具 + 数据管道Connect + 流式处理Spark + SpringBoot Kafka + 消息中间件选型对比 + 总结

网络异常,图片无法展示
|

第九部分:集群管理

通过这一部分的学习,你可以学习一下内容:

  • 熟悉Kafka集群管理相关内容
  • 配置与调优

内容涵盖:(集群的特点 + 集群的能力 + 集群使用场景 + 集群搭建 + 多集群同步 + 总结

网络异常,图片无法展示
|

第十部分:监控

通过这一部分的学习,你可以学习一下内容:

  • 知道Kafka的监控体系
  • 掌握JMX监控指标
  • 数据异动实时提醒

内容涵盖:(监控度量指标 + broker监控指标 + 主题分区监控 + 生产者监控指标 + 消费者监控指标 + Kafka Eagle + 总结

网络异常,图片无法展示
|

写在最后

在当前的趋势下,Kafka被越来越多的互联网独角兽企业所器重,在业务中的使用也越来越多!那么,我们就是说不一定要熟练,但是至少要学会怎么用。这样在业务中自己的能力不断地提升,才有底气和老板、和HR谈涨薪。否则,只是一味地做,不停地996,业务能力却没有提升,那么就会被公司所抛弃,更不要说什么涨薪了,你问问你自己,你配吗?

最后,我想说的是,学习并非难事,而贵在坚持,尤其是在我们参与工作之后,要继续坚持学习就更不容易了。但对于程序员来说,学习是立业之根本,如若放弃学习,被市场淘汰是迟早的事情。所以,学习更多新的知识对于自己来说才是一种更大的投资。

获取方式:需要这份 《Kafka技术手册》的朋友 可以点击此处来获取就可以了!

相关文章
|
4月前
|
消息中间件 分布式计算 监控
腾讯技术官手撸笔记,全新演绎“Kafka部署实战”,已开源
我们知道,当下流行的MQ非常多,不过很多公司在技术选型上还是选择使用Kafka。与其他主流MQ进行对比,我们会发现Kafka最大的优点就是吞吐量高。实际上Kafka是高吞吐低延迟的高并发、高性能的消息中间件,配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。
|
8月前
|
消息中间件 程序员 Apache
阿里RocketMQ创始人首次分享出这份RocketMQ技术内幕神级架构手册
RocketMQ的发展史? RocketMQ的开源正是源于对这种开源文化的认同,开放是为了更好的协同创新,并将这一技术推向新的高度。在经历了阿里巴巴集团内部多年“双11”交易核心链路工业级场景在验证,2016年11月,团队将RocketMQ捐献给全球享有盛誉的Apache软件基金会正式质为孵化项目。 至此,RocketMQ开启了迈向全球顶级开源软件的新征程。
|
10月前
|
消息中间件 存储 分布式计算
分享一份京东大数据大牛私藏:Kafka核心设计与实践原理
Kafka起初是由LinkedIn 公司采用Scala语言开发的一一个多分区、多副本且基于ZooKeeper协调的分布式消息系统,现已被捐献给Apache基金会。目前Kafka已经定位为一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Storm、Spark、Flink等都支持与Kafka集成。
|
10月前
|
消息中间件 数据采集 Java
开发神技!阿里消息中间件进阶手册限时开源,请接住我的下巴
相信大家在实际工作中都用过消息中间件进行系统间数据交换,解决应用解耦、异步消息、流量削峰等问题,由此消息中间件的强大功能想必也不用我多说了!目前业界上关于消息中间件的实现多达好几十种,可谓百花齐放,所用的实现语言同样也五花八门。不管使用哪一个消息中间件,我们的目的都是实现高性能、高可用、可伸缩和最终一致性架构。
|
机器学习/深度学习 SQL 监控
全网最全的安服工程师修炼手册
全网最全的安服工程师修炼手册,主要介绍安全服务工程师的必备技能,也是简单记录下我的安服历程!
734 0
|
消息中间件 存储 分布式计算
kafka学习线路指导入门:包括理论、部署、实战知识汇总整理
kafka学习线路指导入门:包括理论、部署、实战知识汇总整理
355 0
|
Cloud Native OLAP BI
《实时数仓技术入门一本通》电子版下载
本书通过详细的图文介绍,指导读者搞定融合实时数仓&报表、数据仓库、传统OLAP迁移等10+个实战场景,助力实现服务和分析一体化实时数仓。
66 0
《实时数仓技术入门一本通》电子版下载
|
消息中间件 运维 Kafka
呕心沥血20万字《Kafka运维与实战宝典》免费开放下载了
呕心沥血20万字《Kafka运维与实战宝典》免费开放下载了
|
消息中间件 存储 监控
|
消息中间件 存储 NoSQL