Linux系统日志采集

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: Linux系统日志采集

未经许可,禁止以任何形式转载,若要引用,请标注链接地址

全文共计1821字,阅读大概需要3分钟

一、 任务描述

本实验任务主要完成基于ubuntu环境使用flume对linux系统进行数据采集工作。通过完成本实验任务,要求学生了解并掌握基本的flume采集数据方法以及配置格式,为后续进一步学习flume其它知识点做基础,也为从事大数据平台运维工程师、大数据技术支持工程师等岗位工作奠定夯实的技能基础。


二、 任务目标

掌握flume的应用原理

 掌握flume对日志信息的采集过程


三、 任务环境

本次环境是:Ubuntu16.04+flume-ng-1.5.0-cdh5.3.6


四、 任务分析

Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理的操作,并写到各种storage。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。本试验就是通过学习flume工具实现对指定目录下所有的日志文件数据信息进行采集并实时把采集到的信息保存到hdfs中指定的位置。


♥ 知识链接

Flume和kafka的联系

 基于Flume,将“准实时“数据发送给kafka;比如“tail“某个文件的实时数据。对于实时数据分析组件或者同类型的数据消费者,可以通过kafka获取实时数据。


五、 任务实施

步骤1、操作步骤

通过执行命令start-all.sh启动hadoop,在任意指定目录下创建一个文件,例如在/simple目录下执行命令:touch a4.conf并在文件中写入如下内容

1.  a4.sources = r1
2.  a4.channels = c1
3.  a4.sinks = k1
4.  a4.sources.r1.type = spooldir
5.  a4.sources.r1.spoolDir = /simple/logs
6.  
7.  a4.channels.c1.type = memory
8.  a4.channels.c1.capacity = 10000
9.  a4.channels.c1.transactionCapacity = 100
10. 
11. a4.sources.r1.interceptors = i1
12. a4.sources.r1.interceptors.i1.type =  org.apache.flume.interceptor.TimestampInterceptor$Builder 
13. #a2.sinks.k1.type = logger
14. a4.sinks.k1.type = hdfs
15. a4.sinks.k1.hdfs.path =  hdfs://localhost:9000/flume/%Y%m%d
16. a4.sinks.k1.hdfs.filePrefix = event-
17. a4.sinks.k1.hdfs.fileType = DataStream
18. a4.sinks.k1.hdfs.rollCount = 0
19. a4.sinks.k1.hdfs.rollSize = 134217728
20. a4.sinks.k1.hdfs.rollInterval = 60
21. a4.sources.r1.channels = c1
22. a4.sinks.k1.channel = c1

在simple目录下创建一个目录,执行命令:mkdir logs 。如图1所示


4e574a6478924001a130fde1ec11eb03.png


图1 创建文件夹


在simple目录下创建文件a.log,执行命令touch a.log,编辑内容,如图2所示


df0187583a6c43bc99153cbf19e96c15.png


图2 创建文件并编辑


切换到bin目录下,执行flume命令:./flume-ng agent -n a4 -f /simple/a4.conf -c …/conf/ -Dflume.root.logger=INFO,console。如图3所示


cd5adf87bbfb471fb4df04749abe43ae.png


图3 启动flume


执行上一步命令之后,同时在另外一个终端中,在simple目录下通过执行拷贝命令:cp a.log logs/a1.log和cp a.log logs/a2.log实现把a.log日志文件拷贝到logs目录下,此时logs目录下的日志文件会被采集并保存到hdfs指定位置/flume目录下 。如图4图5所示

33d3133fbdd44798b9ba013253d1d84d.png



图4 拷贝文件到指定目录


7aaf3b5db3424b5aa5315ea05f97da6a.png


图5 查看hdfs上采集的数据


如果希望继续查看采集的信息在hdfs中生成的文件中的具体内容,可通过hdfs dfs -cat命令去查看。如图6所示

6a8316880cdc4739a3ed591442d4aea1.png



图6 查看具体内容


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
8天前
|
Linux
Linux系统之whereis命令的基本使用
Linux系统之whereis命令的基本使用
50 23
Linux系统之whereis命令的基本使用
|
17天前
|
存储 前端开发 数据可视化
Grafana Loki,轻量级日志系统
本文介绍了基于Grafana、Loki和Alloy构建的轻量级日志系统。Loki是一个由Grafana Labs开发的日志聚合系统,具备高可用性和多租户支持,专注于日志而非指标,通过标签索引而非内容索引实现高效存储。Alloy则是用于收集和转发日志至Loki的强大工具。文章详细描述了系统的架构、组件及其工作流程,并提供了快速搭建指南,包括准备步骤、部署命令及验证方法。此外,还展示了如何使用Grafana查看日志,以及一些基本的LogQL查询示例。最后,作者探讨了Loki架构的独特之处,提出了“巨型单体模块化”的概念,即一个应用既可单体部署也可分布式部署,整体协同实现全部功能。
277 69
Grafana Loki,轻量级日志系统
|
1月前
|
缓存 安全 Linux
Linux系统查看操作系统版本信息、CPU信息、模块信息
在Linux系统中,常用命令可帮助用户查看操作系统版本、CPU信息和模块信息
111 23
|
1月前
|
存储 安全 Java
Spring Boot 3 集成Spring AOP实现系统日志记录
本文介绍了如何在Spring Boot 3中集成Spring AOP实现系统日志记录功能。通过定义`SysLog`注解和配置相应的AOP切面,可以在方法执行前后自动记录日志信息,包括操作的开始时间、结束时间、请求参数、返回结果、异常信息等,并将这些信息保存到数据库中。此外,还使用了`ThreadLocal`变量来存储每个线程独立的日志数据,确保线程安全。文中还展示了项目实战中的部分代码片段,以及基于Spring Boot 3 + Vue 3构建的快速开发框架的简介与内置功能列表。此框架结合了当前主流技术栈,提供了用户管理、权限控制、接口文档自动生成等多项实用特性。
83 8
|
2月前
|
存储 运维 监控
Linux--深入理与解linux文件系统与日志文件分析
深入理解 Linux 文件系统和日志文件分析,对于系统管理员和运维工程师来说至关重要。文件系统管理涉及到文件的组织、存储和检索,而日志文件则记录了系统和应用的运行状态,是排查故障和维护系统的重要依据。通过掌握文件系统和日志文件的管理和分析技能,可以有效提升系统的稳定性和安全性。
58 7
|
2月前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
2月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
121 13
|
2月前
|
存储 缓存 监控
Linux缓存管理:如何安全地清理系统缓存
在Linux系统中,内存管理至关重要。本文详细介绍了如何安全地清理系统缓存,特别是通过使用`/proc/sys/vm/drop_caches`接口。内容包括清理缓存的原因、步骤、注意事项和最佳实践,帮助你在必要时优化系统性能。
234 78
|
2月前
|
Ubuntu Linux C++
Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)
本文介绍了如何在Windows 10上安装并使用Linux子系统。首先,通过应用商店安装Windows Terminal和Linux系统(如Ubuntu)。接着,在控制面板中启用“适用于Linux的Windows子系统”并重启电脑。最后,在Windows Terminal中选择安装的Linux系统即可开始使用。文中还提供了注意事项和进一步配置的链接。
67 0
|
监控 Linux Windows
Linux下清除系统日志方法
摘要:相信大家都是用过Windows的人。对于Windows下饱受诟病的各种垃圾文件都需要自己想办法删除,不然你的系统将会变得越来越大,越来越迟钝!windows怎么清理垃圾相信大家都知道的,那么linux下怎么清理系统垃圾呢?  Linux的文件系统比Windows的要优秀,不会产生碎片,对于长时间运行的服务器来说尤为重要,而且Linux系统本身也不会像Windows一样产生大量的垃圾文件。
2543 0