我个人的kafka broker和zookeeper集群实践（★firecat推荐★）-阿里云开发者社区

我个人的kafka broker和zookeeper集群实践（★firecat推荐★）

2021-11-14 340

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

注册配置 MSE Nacos/ZooKeeper，118元/月

服务治理 MSE Sentinel/OpenSergo，Agent数量不受限

云原生网关 MSE Higress，422元/月

简介： 我个人的kafka broker和zookeeper集群实践（★firecat推荐★）

kafka是通过zookeeper来管理集群。 kafka软件包内虽然包括了一个简版的zookeeper，但是简易版功能有限。在生产环境下，建议还是直接下载官方zookeeper软件。

http://zookeeper.apache.org/

http://mirror.bit.edu.cn/apache/zookeeper/

建议使用稳定版，/stable/zookeeper-3.4.10.tar.gz

kafka使用版本是kafka_2.12-1.1.0

1、zookeeper环境部署

chmod -R 777 zookeeper-3.4.10

./zkServer.sh start #启动zookeeper服务器

./zkServer.sh status#查看状态

./zkCli.sh -server 127.0.0.1:2181 #启动客户端

[zk: 127.0.0.1:2181(CONNECTED) 0] ls / #查看zookeeper目录结构

[zookeeper]

[zk: 127.0.0.1:2181(CONNECTED) 1] ls /brokers/ids #查看已启动的代理节点

Node does not exist: /brokers/ids

我们可以通过jps命令来查看zk是否启动

[root@bogon bin]# jps

3952 Jps

3921 QuorumPeerMain

2、zookeeper配置文件（本人电脑有限，仅使用一台虚拟机来实现分布式集群）

（1）把zookeeper文件夹复制三份，我们仅修改\conf\zoo.cfg

文件夹zookeeper-0

dataDir=/tmp/zookeeper/data00

clientPort=2181

server.0=172.16.6.170:20881:30881

server.1=172.16.6.170:20882:30882

server.2=172.16.6.170:20883:30883

文件夹zookeeper-1

dataDir=/tmp/zookeeper/data01

clientPort=2182

server.0=172.16.6.170:20881:30881

server.1=172.16.6.170:20882:30882

server.2=172.16.6.170:20883:30883

文件夹zookeeper-3

dataDir=/tmp/zookeeper/data02

clientPort=2183

server.0=172.16.6.170:20881:30881

server.1=172.16.6.170:20882:30882

server.2=172.16.6.170:20883:30883

（2）分别在文件夹/tmp/zookeeper/data00,data01和data02下面新建myid文件，文件内容只有一个数字，代表zookeeper节点的唯一id，即要确保此id在集群内唯一，且要跟配置文件中的server.0、server.1、server.2 对应上。

终端命令：

cd data00

echo 0 > myid

cd ../data01

echo 1 > myid

cd ../data02

echo 2 > myid

3、kafka broker配置文件（本人电脑有限，仅使用一台虚拟机来实现分布式集群）

我们仅仅修改server.properties文件，其他文件（例如producer.properties和consumer.properties）不动。

把\config\server.properties文件复制2份，分别是server.properties，server_1.properties，server_2.properties，

文件server.properties

broker.id=0

listeners=PLAINTEXT://172.16.6.170:9092 ##不要写成PLAINTEXT://0.0.0.0:9092

port=9092

host.name=172.16.6.170

log.dirs=/tmp/kafka-logs-0

num.partitions=3

zookeeper.connect=172.16.6.170:2181,172.16.6.170:2182,172.16.6.170:2183

文件server_1.properties

broker.id=1

listeners=PLAINTEXT://172.16.6.170:9093

port=9093

host.name=172.16.6.170

log.dirs=/tmp/kafka-logs-1

num.partitions=3

zookeeper.connect=172.16.6.170:2181,172.16.6.170:2182,172.16.6.170:2183

文件server_2.properties

broker.id=2

listeners=PLAINTEXT://172.16.6.170:9094

port=9094

host.name=172.16.6.170

log.dirs=/tmp/kafka-logs-2

num.partitions=3

zookeeper.connect=172.16.6.170:2181,172.16.6.170:2182,172.16.6.170:2183

4、几点心得

（1）单纯的kafka broker集群没有意义，一台宕机照样出错，必须带上zookeeper集群一起。

（2）broker和zookeeper都至少要三台服务器，奇数台。

（3）生产者，以下几种方式，我个人实践觉得没有区别

./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

./bin/kafka-console-producer.sh --broker-list 172.16.6.170:9092 --topic test

./bin/kafka-console-producer.sh --broker-list 172.16.6.170:9092,172.16.6.170:9093,172.16.6.170:9094 --topic test

（4）使用集群时，生产者和消费者执行之前，用户必须手动先创建topic，指定zookeeper节点列表；

（5）本人看了博客，Kafka 单节点多Kafka Broker集群

发现broker的server.properties可以不需要上述那么复杂，简单即可：

broker.id=0

listeners=PLAINTEXT://:9092

log.dirs=/tmp/kafka-logs-0

num.partitions=3

zookeeper.connect=172.16.6.170:2181,172.16.6.170:2182,172.16.6.170:2183

省略的

port=9092

host.name=172.16.6.170

这些参数是0.9之前的版本带的参数，从1.0.0开始没有这些参数了。

5、常用终端命令

查看进程是否启动

netstat -tunlp|egrep "(2181|2182|2183|9092|9093|9094)"

启动zookeeper

./zkServer.sh start

启动kafka broker

./bin/kafka-server-start.sh -daemon config/server.properties

./bin/kafka-server-start.sh -daemon config/server_1.properties

./bin/kafka-server-start.sh -daemon config/server_2.properties

创建主题

./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 3 --topic test

./bin/kafka-topics.sh --create --zookeeper 172.16.6.170:2181,172.16.6.170:2182,172.16.6.170:2183 --replication-factor 3 --partitions 3 --topic test

./bin/kafka-topics.sh --describe --zookeeper 172.16.6.170:2181 --topic test

生产

./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

./bin/kafka-console-producer.sh --broker-list 172.16.6.170:9092 --topic test

./bin/kafka-console-producer.sh --broker-list 172.16.6.170:9092,172.16.6.170:9093,,172.16.6.170:9094 --topic test

消费

./bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning

./bin/kafka-console-consumer.sh --zookeeper 172.16.6.170:2181 --topic test --from-beginning

./bin/kafka-console-consumer.sh --zookeeper 172.16.6.170:2182 --topic test --from-beginning

zookeeper客户端连接

./zkCli.sh -server 127.0.0.1:2181

6、参数解释

（1）server.properties文件

broker.id=0 #当前机器在集群中的唯一标识，和zookeeper的myid性质一样

port=19092 #当前kafka对外提供服务的端口默认是9092

host.name=192.168.7.100 #这个参数默认是关闭的，在0.8.1有个bug，DNS解析问题，失败率的问题。

num.network.threads=3 #这个是borker进行网络处理的线程数

num.io.threads=8 #这个是borker进行I/O处理的线程数

log.dirs=/opt/kafka/kafkalogs/ #消息存放的目录，这个目录可以配置为“，”逗号分割的表达式，上面的num.io.threads要大于这个目录的个数这个目录，如果配置多个目录，新创建的topic他把消息持久化的地方是，当前以逗号分割的目录中，那个分区数最少就放那一个

socket.send.buffer.bytes=102400 #发送缓冲区buffer大小，数据不是一下子就发送的，先回存储到缓冲区了到达一定的大小后在发送，能提高性能

socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小，当数据到达一定大小后在序列化到磁盘

socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数，这个值不能超过java的堆栈大小

num.partitions=1 #默认的分区数，一个topic默认1个分区数

log.retention.hours=168 #默认消息的最大持久化时间，168小时，7天

message.max.byte=5242880 #消息保存的最大值5M

default.replication.factor=2 #kafka保存消息的副本数，如果一个副本失效了，另一个还可以继续提供服务

replica.fetch.max.bytes=5242880 #取消息的最大直接数

log.segment.bytes=1073741824 #这个参数是：因为kafka的消息是以追加的形式落地到文件，当超过这个值的时候，kafka会新起一个文件

log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间（log.retention.hours=168 ），到目录查看是否有过期的消息如果有，删除

log.cleaner.enable=false #是否启用log压缩，一般不用启用，启用的话可以提高性能

zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口

我个人的kafka broker和zookeeper集群实践（★firecat推荐★）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

我个人的kafka broker和zookeeper集群实践（★firecat推荐★）

热门文章

最新文章

相关课程

相关电子书

相关实验场景