flume的安装和配置

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: flume的安装和配置

一、任务描述

Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种storage。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。本试验就是通过学习flume工具的安装,为后面学习flume实现对数据信息的采集以便于解决实际中存在的问题打下基础。


二、任务目标

熟练flume的安装和配置,理解flume的原理和应用


三、任务环境

本次环境是:Ubuntu16.04 + jdk1.8.0_73 + hadoop-2.7.3+flume-1.7.0


四、任务分析

解压fulem的安装包,然后配置环境变量,修改flume配置文件,最后测试是否安装成功。


五、任务实施

步骤1、解压flume压缩包

在linux终端执行切换命令:【cd /simple/soft】并查看是否存在解压后flume文件,如果不存在,则需要查看/simple/soft目录下是否存在flume压缩包文件apache-flume-1.7.0-bin.tar.gz。如图1所示

5999df49d81d4581aa5174010efd3f0c.png



图1 查看压缩包所在目录


在linux命令终端执行解压命令:【tar -zxvf apache-flume-1.7.0-bin.tar.gz -C /simple】对flume压缩包进行解压 。如图2所示


5c3b3a81df9445b7bbc222e7f1dd5280.png


图2 解压需要的压缩包


解压flume压缩包之后,通过执行ls命令:【ls apache-flume-1.7.0-bin/】来查看flume解压后的目录结构。如图3所示


4245d42b5d1249359d0e84c2d63a49f9.png


图3 查看flume的目录结构


为了方便美观将apaceh-flume-1.7.0-bin修改为flume。如图4所示


35ad712eeccd453a9d54a61125222f14.png


图4 修改名字


进入flume目录下的bin目录下的内容列表。可以看到该目录下有一个执行文件flume-ng 。如图5所示


b5339095b1104b1d9eb68e136987ab1e.png


图5 查看执行文件


输入命令【vim /etc/profile】进入配置文件,配置flume的环境变量,配置完成后保存,然后输入命令【source /etc/profile】使环境变量生效。如图6所示

4be7dc4c0e5c416496e7a708017b9632.png



图6 配置环境变量


♥ 知识链接

概念

 Flume的一些核心概念:

name Value
(1)Events 一个数据单元,带有一个可选的消息头,可以是日志记录、avro 对象等。
(2)Agent JVM中一个独立的Flume进程,包含组件Source、Channel、Sink。
(3)Client 运行于一个独立线程,用于生产数据并将其发送给Agent。
(4)Source 用来消费传递到该组件的Event,从Client收集数据,传递给Channel。
(5)Channel 中转Event的一个临时存储,保存Source组件传递过来的Event,其实就是连接 Source 和 Sink ,有点像一个消息队列。
(6)Sink 从Channel收集数据,运行在一个独立线程。

步骤2、 配置flume

在/simple/flume/conf目录下可以看到有个配置文件模板flume-env.sh.template,首先更改该文件名,需要执行命令:mv flume-env.sh.template flume-env.sh对conf目录下的配置文件进行重命名。如图6所示


bce6938fec0946f2b7c7019e6f9191a0.png


图7 重命名配置文件

 首先通过编辑命令:【vim flume-env.sh】进入配置文件中然后修改配置文件中的内容。如图8所示

bb82315e30474f5198347e20a1966369.png



图8 编辑配置文件


六、任务测试

在任意目录下输入【flume-ng version】查看flume是否安装成功。如图9


0222379b9bff4e6b9d6ec3dbd0bdcf80.png


图9 检查是否安装成功

24f686de9b7147f593f6ac9e918c313b.png



相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
数据采集 消息中间件 监控
Flume数据采集系统设计与配置实战:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入探讨Apache Flume的数据采集系统设计,涵盖Flume Agent、Source、Channel、Sink的核心概念及其配置实战。通过实例展示了文件日志收集、网络数据接收、命令行实时数据捕获等场景。此外,还讨论了Flume与同类工具的对比、实际项目挑战及解决方案,以及未来发展趋势。提供配置示例帮助理解Flume在数据集成、日志收集中的应用,为面试准备提供扎实的理论与实践支持。
573 1
flume的log4j.properties配置说明
flume的log4j.properties配置说明
241 0
|
消息中间件 分布式计算 大数据
【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
939 0
|
数据采集 消息中间件 存储
Flume 快速入门【概述、安装、拦截器】
Apache Flume 是一个开源的数据采集工具,用于从各种数据源(如日志、网络数据、消息队列)收集大规模数据,并将其传输和加载到数据存储系统(如 HDFS、HBase、Hive)。Flume 由数据源(Source)、通道(Channel)、拦截器(Interceptor)和接收器(Sink)组成,支持灵活配置以适应不同的数据流处理需求。安装 Flume 包括解压软件包、配置环境变量和调整日志及内存设置。配置文件定义数据源、通道、拦截器和接收器,拦截器允许预处理数据。Flume 适用于构建数据管道,整合分散数据到中心存储系统,便于分析和报告。
2400 3
|
存储 监控 Linux
Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
【2月更文挑战第17天】Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
370 1
Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
|
XML 数据格式
Flume【付诸实践 01】flume1.9.0版 配置格式说明+常用案例分享(ExecSource+SpoolingDirectorySource+HDFSSink+AvroSourceSink)
【2月更文挑战第19天】Flume【付诸实践 01】flume1.9.0版 配置格式说明+常用案例分享(ExecSource+SpoolingDirectorySource+HDFSSink+AvroSourceSink)
338 1
|
消息中间件 存储 SQL
Flume【基础知识 01】简介 + 基本架构及核心概念 + 架构模式 + Agent内部原理 + 配置格式(一篇即可入门Flume)
【2月更文挑战第18天】Flume【基础知识 01】简介 + 基本架构及核心概念 + 架构模式 + Agent内部原理 + 配置格式(一篇即可入门Flume)
3896 0
|
存储 监控 Linux
Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
358 0
|
数据采集 消息中间件 缓存
Apache Flume及快速安装
Apache Flume及快速安装
252 0
|
分布式数据库 Hbase
Flume安装及配置
Flume 提供了大量内置的 Source、Channel 和 Sink 类型。而且不同类型的 Source、Channel 和 Sink 可以自由组合—–组合方式基于配置文件的设置,非常灵活。比如:Channel 可以把事件暂存在内存里,也可以持久化到本地硬盘上。Sink 可以把日志写入 HDFS、HBase,甚至是另外一个 Source 等。

热门文章

最新文章