Apache Kafka学习 (一)

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 前言:最近公司开始要研究大数据的消息记录,于是开始研究kafka。 市面上kafka的书很少,有的也版本比较落后,于是仗着自己英文还不错,上官网直接学习。 ^_^   1. 开始 - 基本概念 学习一样东西,我们首先要知道它是什么。

前言:最近公司开始要研究大数据的消息记录,于是开始研究kafka。

市面上kafka的书很少,有的也版本比较落后,于是仗着自己英文还不错,上官网直接学习。 ^_^

 

1. 开始 - 基本概念

学习一样东西,我们首先要知道它是什么。

那么kafka是什么呢?

照官网的解释: 

Apache Kafka™ is a distributed streaming platform

(Kafka是一个分布式的流式数据平台。)

照着官网的解释,kafka拥有以下3项主要能力:

1) 能够在流记录上进行发布和订阅,类似于消息队列了。

2) 能够容错存储流记录。

3) 能够处理流记录。

 

那么,接下来又要问了,我们用kafka的好处是什么呢?

主要有以下2点好处:

1) 在系统或者应用之间可以构建可依赖的实时的流数据管道。

2)  可以构建实时的处理流数据的系统。

 

2. 核心概念

* kafka以集群的方式运行在一台或多态服务器上。

* kafka集群根据topic(主题)对存储的流记录进行分类。

* 每条流记录包含一个键值对和一个时间戳。

 

3. 核心API

* Producer(生产者) API 允许应用程序发布流记录到一个或多个kafka主题。

* Consumer(消费者) API允许应用程序订阅一个或多个kafka主题,从而对这些主题下的流数据进行处理。

* Streams(流) API则负责高效地处理各个主题下的流记录。

* Connector(连接器) API允许构建可重用的生产者或消费者,并且让他们和现有的系统进行对接。

  (举个例子:一个连接到关系型数据库的连接器可以捕捉表格的每次改变)

 

 

4. 主题和日志

一个主题可以被多个消费者订阅。

 kafka的每个主题是以分区日志的形式维护的。

日志中的每个分区分布在集群中的各个服务器上。

有一台服务器扮演leader(头领)的角色,而其余的服务器则是followers(跟随者)。

 

5. 生产者(Producer)和消费者(Consumer)

 

上图是2台服务器的kafka集群带了4个分区(P0 - P3), 2组Consumer订阅Producer发布的主题消息。

 

6. 安装和启动

1)下载kafka源码

https://www.apache.org/dyn/closer.cgi?path=/kafka/0.10.2.0/kafka_2.11-0.10.2.0.tgz

> tar -xzf kafka_2.11-0.10.2.0.tgz
> cd kafka_2.11-0.10.2.0

 

2) 启动服务器

由于kafka使用zookeeper来管理集群,所以你先需要启动zookeeper。

如果你没有安装zookeeper,你可以是用户kafka的内置脚本启动一个单节点的zookeeper实例。
  2-1) 启动单节点zookeeper实例:

  > bin/zookeeper-server-start.sh config/zookeeper.properties

  2-2) 启动kafka server:

  > bin/kafka-server-start.sh config/server.properties

   2-3) 创建topic(主题)

   > bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

   2-4) 使用list命令查看所有主题

   > bin/kafka-topics.sh --list --zookeeper localhost:2181

     显示结果:  test

 

7. 发送消息

# 运行生产者脚本,并向刚刚创建的test主题发送一些消息

> bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

你可以打一些字,如下:

哈哈哈

嘿嘿,你好啊

 

8. 接收消息

# 运行消费者脚本,从test主题订阅消息

> bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

  收到消息:

  哈哈哈

  嘿嘿,你好啊

 

我们以上演示需要开启4个控制台,效果如下:

 

 

好了,第一次笔记到此结束,后续会继续阅读学习。 ^_^

 

 

 




目录
相关文章
|
2月前
|
消息中间件 存储 大数据
Apache Kafka: 强大消息队列系统的介绍与使用
Apache Kafka: 强大消息队列系统的介绍与使用
|
4月前
|
消息中间件 Kafka Linux
Apache Kafka-初体验Kafka(03)-Centos7下搭建kafka集群
Apache Kafka-初体验Kafka(03)-Centos7下搭建kafka集群
70 0
|
4月前
|
分布式计算 Java 大数据
IO流【Java对象的序列化和反序列化、File类在IO中的作用、装饰器模式构建IO流体系、Apache commons-io工具包的使用】(四)-全面详解(学习总结---从入门到深化)
IO流【Java对象的序列化和反序列化、File类在IO中的作用、装饰器模式构建IO流体系、Apache commons-io工具包的使用】(四)-全面详解(学习总结---从入门到深化)
53 0
|
16天前
|
消息中间件 存储 Java
深度探索:使用Apache Kafka构建高效Java消息队列处理系统
【4月更文挑战第17天】本文介绍了在Java环境下使用Apache Kafka进行消息队列处理的方法。Kafka是一个分布式流处理平台,采用发布/订阅模型,支持高效的消息生产和消费。文章详细讲解了Kafka的核心概念,包括主题、生产者和消费者,以及消息的存储和消费流程。此外,还展示了Java代码示例,说明如何创建生产者和消费者。最后,讨论了在高并发场景下的优化策略,如分区、消息压缩和批处理。通过理解和应用这些策略,可以构建高性能的消息系统。
|
29天前
|
消息中间件 存储 负载均衡
消息队列学习之kafka
【4月更文挑战第2天】消息队列学习之kafka,一个分布式的,支持多分区、多副本,基于 Zookeeper 的分布式消息流平台。
19 2
|
3月前
|
消息中间件 存储 缓存
闭关学习一周kafka,原来他这么快是有原因的!
无论 kafka 作为 MQ 也好,作为存储层也罢,无非就是两个功能(好简单的样子),一是 Producer 生产的数据存到 broker,二是 Consumer 从 broker 读取数据。那 Kafka 的快也就体现在读写两个方面了,下面我们就聊聊 Kafka 快的原因。
31 1
|
4月前
|
消息中间件 负载均衡 Kafka
Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)
Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)
214 2
|
4月前
|
消息中间件 Java Kafka
Apache Kafka-初体验Kafka(04)-Java客户端操作Kafka
Apache Kafka-初体验Kafka(04)-Java客户端操作Kafka
32 0
|
3月前
|
消息中间件 安全 Kafka
2024年了,如何更好的搭建Kafka集群?
我们基于Kraft模式和Docker Compose同时采用最新版Kafka v3.6.1来搭建集群。
460 2
2024年了,如何更好的搭建Kafka集群?
|
4月前
|
消息中间件 存储 数据可视化
kafka高可用集群搭建
kafka高可用集群搭建
46 0

推荐镜像

更多