大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper-阿里云开发者社区

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

2024-10-13 561

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

Hadoop（已更完）

HDFS（已更完）

MapReduce（已更完）

Hive（已更完）

Flume（已更完）

Sqoop（已更完）

Zookeeper（已更完）

HBase（已更完）

Redis （已更完）

Kafka （正在更新…）

章节内容

上节我们完成的内容：

Kafka核心概念介绍

Producer

Consumer

Topic

Partition

等等

简单介绍

Kafka在3版本以下都是需要ZooKeeper来做协调器的，在3版本以上，Kafka实现了自己的协议去做高可用，但是大家也没有都切换到这个新的方案上，还是比较保守的（如果在生产环境上）。

Kafka 2.X

Kafka 2.X 是 Kafka 的一个重要版本系列，包含了多个子版本（如 2.0.0, 2.1.0, 2.3.0 等）。这一系列版本为 Kafka 引入了许多新特性和改进：

Core 新特性

Kafka Streams 增强：增加了 KStream-KTable 外连接、全局表（Global Tables）、交互式查询（Interactive Queries）等功能。

更好的性能： Kafka 2.X 版本改进了 broker 和 producer 的性能，包括改进的内存管理和日志管理系统。

动态配置：支持动态配置 Broker、Topic 和 Broker 客户端，不再需要重启 Broker 来更新这些配置。

Kafka Connect 改进

集成 REST API：改进了 Kafka Connect 的 REST API，使得管理和监控 Connect 任务更加方便。

增量镜像任务：支持基于增量数据的镜像任务（MirrorMaker），改进了跨数据中心的数据复制。

Security 增强

Kerberos 支持增强：对 Kerberos 的支持更加健壮和易用，包括支持多个 Kerberos 域和对不同 Kafka 组件进行身份验证。

ACL 改进：增加了对 ACL（访问控制列表）的增强支持，简化了安全性配置。

日志管理

基于时间的日志保留策略： Kafka 2.X 引入了基于时间的日志保留策略，可以按时间段（如每周）自动删除旧的日志。

Kafka 3.X

Kafka 3.X 是 Kafka 的另一个重要版本系列，随着 Kafka 进入 3.X 时代，系统变得更加稳定和高效，同时还引入了一些重大的变化和新特性。

KRaft (Kafka Raft)

KRaft 模式： Kafka 3.X 引入了 KRaft 模式，作为 Kafka 的新控制平面架构，目的是替代原先的 ZooKeeper 依赖。KRaft 使用 Raft 协议来管理控制平面元数据，使得 Kafka 可以在没有 ZooKeeper 的情况下运行。

Zookeeper 逐步废弃：随着 KRaft 的引入，Kafka 开始逐步废弃对 ZooKeeper 的依赖，从而简化了 Kafka 的运维和部署。

性能与可扩展性

延迟优化： Kafka 3.X 进一步优化了延迟和吞吐量，使得在大规模数据流处理中的表现更佳。

分区的增强：支持更多的分区，改进了分区管理和分配策略，使得 Kafka 在大规模集群中运行更加高效。

流式处理改进

Kafka Streams：改进了 Kafka Streams 的性能，并引入了新的操作符和优化策略，使得流式处理更加灵活和高效。

流处理的扩展性：支持更大规模的流处理应用，并增强了状态存储和管理能力。

兼容性和升级

兼容性改进： Kafka 3.X 保持了对 Kafka 2.X 客户端的兼容性，使得从 2.X 版本升级到 3.X 版本更加平滑。

滚动升级：提供了滚动升级支持，使得 Kafka 集群可以在不中断服务的情况下，从 2.X 升级到 3.X。

Kafka Connect

改进的错误处理：增强了 Kafka Connect 的错误处理能力，提供了更好的错误隔离和恢复机制。

更好的监控：改进了对 Connect 任务的监控，提供了更多的指标和管理选项。

ZooKeeper

环境变量

# 我们要确保有ZooKeeper环境，之前已经安装过了。最好确认一下你的ZooKeeper环境是正确的。
vim /etc/profile

检查你的环境变量是否配置完毕，我这里是 3台云服务器都配置好了。

# zookeeper
export ZOOKEEPER_HOME=/opt/servers/apache-zookeeper-3.8.4-bin
export PATH=$PATH:$ZOOKEEPER_HOME/bin

配置的结果大致如下：

记得刷新环境变量

source /etc/profile

如果你出现下图的样子，你的ZK是没有问题的。

可以从下图中看到，我这台是 Follower 节点。主节点好像是 h122 节点。

Kafka

下载项目

我这里选择的是 2.7 的版本，你可以到 GitHub 或者官方下载

https://github.com/apache/kafka/releases/tag/2.7.2
https://kafka.apache.org/downloads

GitHub是源码，需要自己编译！！！

官方下载地址是编译的：

解压配置

下载好之后，上传到服务器上，或者直接在服务器上 wget 进行下载。

tar -zxvf kafka_2.12-2.7.2.tgz

按照之前的规范，我们需要进行移动处理：

mv kafka_2.12-2.7.2 ../servers

环境变量

vim /etc/profile

写入如下的环境变量内容

# kafka
export KAFKA_HOME=/opt/servers/kafka_2.12-2.7.2
export PATH=$PATH:$KAFKA_HOME/bin

记得刷新环境变量

启动配置

Kafka是需要连接ZooKeeper的，所以我们需要修改Kafka的配置。

vim /opt/servers/kafka_2.12-2.7.2/config/server.properties

ZK配置

修改 zookeeper.connet 这一行：

log配置

这里注意修改一下，同时记得把文件夹创建出来

启动服务

kafka-server-start.sh /opt/servers/kafka_2.12-2.7.2/config/server.properties

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

环境变量

Kafka

下载项目

解压配置

环境变量

启动配置

ZK配置

log配置

启动服务

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper

环境变量

Kafka

下载项目

解压配置

环境变量

启动配置

ZK配置

log配置

启动服务

热门文章

最新文章

相关课程

相关电子书

推荐镜像

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper