Linux系统日志采集

简介: Linux系统日志采集

未经许可,禁止以任何形式转载,若要引用,请标注链接地址

全文共计1821字,阅读大概需要3分钟

一、 任务描述

本实验任务主要完成基于ubuntu环境使用flume对linux系统进行数据采集工作。通过完成本实验任务,要求学生了解并掌握基本的flume采集数据方法以及配置格式,为后续进一步学习flume其它知识点做基础,也为从事大数据平台运维工程师、大数据技术支持工程师等岗位工作奠定夯实的技能基础。


二、 任务目标

掌握flume的应用原理

 掌握flume对日志信息的采集过程


三、 任务环境

本次环境是:Ubuntu16.04+flume-ng-1.5.0-cdh5.3.6


四、 任务分析

Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理的操作,并写到各种storage。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。本试验就是通过学习flume工具实现对指定目录下所有的日志文件数据信息进行采集并实时把采集到的信息保存到hdfs中指定的位置。


♥ 知识链接

Flume和kafka的联系

 基于Flume,将“准实时“数据发送给kafka;比如“tail“某个文件的实时数据。对于实时数据分析组件或者同类型的数据消费者,可以通过kafka获取实时数据。


五、 任务实施

步骤1、操作步骤

通过执行命令start-all.sh启动hadoop,在任意指定目录下创建一个文件,例如在/simple目录下执行命令:touch a4.conf并在文件中写入如下内容

1.  a4.sources = r1
2.  a4.channels = c1
3.  a4.sinks = k1
4.  a4.sources.r1.type = spooldir
5.  a4.sources.r1.spoolDir = /simple/logs
6.  
7.  a4.channels.c1.type = memory
8.  a4.channels.c1.capacity = 10000
9.  a4.channels.c1.transactionCapacity = 100
10. 
11. a4.sources.r1.interceptors = i1
12. a4.sources.r1.interceptors.i1.type =  org.apache.flume.interceptor.TimestampInterceptor$Builder 
13. #a2.sinks.k1.type = logger
14. a4.sinks.k1.type = hdfs
15. a4.sinks.k1.hdfs.path =  hdfs://localhost:9000/flume/%Y%m%d
16. a4.sinks.k1.hdfs.filePrefix = event-
17. a4.sinks.k1.hdfs.fileType = DataStream
18. a4.sinks.k1.hdfs.rollCount = 0
19. a4.sinks.k1.hdfs.rollSize = 134217728
20. a4.sinks.k1.hdfs.rollInterval = 60
21. a4.sources.r1.channels = c1
22. a4.sinks.k1.channel = c1

在simple目录下创建一个目录,执行命令:mkdir logs 。如图1所示


4e574a6478924001a130fde1ec11eb03.png


图1 创建文件夹


在simple目录下创建文件a.log,执行命令touch a.log,编辑内容,如图2所示


df0187583a6c43bc99153cbf19e96c15.png


图2 创建文件并编辑


切换到bin目录下,执行flume命令:./flume-ng agent -n a4 -f /simple/a4.conf -c …/conf/ -Dflume.root.logger=INFO,console。如图3所示


cd5adf87bbfb471fb4df04749abe43ae.png


图3 启动flume


执行上一步命令之后,同时在另外一个终端中,在simple目录下通过执行拷贝命令:cp a.log logs/a1.log和cp a.log logs/a2.log实现把a.log日志文件拷贝到logs目录下,此时logs目录下的日志文件会被采集并保存到hdfs指定位置/flume目录下 。如图4图5所示

33d3133fbdd44798b9ba013253d1d84d.png



图4 拷贝文件到指定目录


7aaf3b5db3424b5aa5315ea05f97da6a.png


图5 查看hdfs上采集的数据


如果希望继续查看采集的信息在hdfs中生成的文件中的具体内容,可通过hdfs dfs -cat命令去查看。如图6所示

6a8316880cdc4739a3ed591442d4aea1.png



图6 查看具体内容


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1天前
|
编解码 Ubuntu Linux
|
1天前
|
Linux
|
1天前
|
Linux
请问如何在Linux系统中删除一个磁盘分区
请问如何在Linux系统中删除一个磁盘分区
|
1天前
|
Linux
Linux系统的磁盘管理
Linux系统的磁盘管理
|
1天前
|
Unix Linux Shell
Linux系统使用超详细(一)
Linux系统是一种开源的、类Unix操作系统内核的实现,它基于Unix的设计原理和思想,并在全球范围内广泛应用。以下是对Linux系统的详细描述:
|
2天前
|
Ubuntu Linux 编译器
【Linux】详解动静态库的制作和使用&&动静态库在系统中的配置步骤
【Linux】详解动静态库的制作和使用&&动静态库在系统中的配置步骤
|
2天前
|
Linux Windows
虚拟机添加新硬盘之linux系统篇
虚拟机添加新硬盘之linux系统篇
|
2天前
|
监控 安全 Linux
Linux系统入侵排查(三)
本文介绍了Linux系统入侵排查的相关知识。首先解释了进行系统入侵排查的原因,即当企业遭受黑客攻击、系统崩溃或其他安全事件时,需要迅速恢复系统并找出入侵来源。接着,重点讲述了日志入侵排查的重要性,因为日志文件记录了系统的重要活动,可以提供入侵行为的线索。
|
2天前
|
安全 Linux Shell
Linux系统入侵排查(二)
本文介绍了Linux系统入侵排查的步骤,包括检查历史命令记录、可疑端口和进程、开机启动项以及定时任务。作者强调了了解这些技能对于攻防两端的重要性,并提供了相关命令示例,如查看`/root/.bash_history`记录、使用`netstat`分析网络连接、检查`/etc/rc.local`和`/etc/cron.*`目录下的可疑脚本等。此外,还提到了如何查看和管理服务的自启动设置,以判断是否被恶意篡改。文章旨在帮助读者掌握Linux服务器安全维护的基本技巧。
|
3天前
|
缓存 安全 Linux
Linux系统入侵排查(一)
本文探讨了在遭遇黑客入侵或系统异常时进行应急响应和排查的必要性,重点介绍了基于Kali Linux的入侵排查步骤。排查的目标是找出潜在的恶意活动,恢复系统的安全性,并防止未来攻击。总结来说,进行Linux系统入侵排查需要密切关注账号安全,跟踪历史命令,及时识别并消除安全隐患。同时,保持对最新攻击手段和技术的了解,以便更好地防御和应对潜在的网络安全威胁。