开源日志收集软件fluentd 转发(forward)架构配置

简介:

需求:

通过开源软件fluentd收集各个设备的apache访问日志到fluentd的转发服务器中,然后通过webHDFS接口,写入到hdfs文件系统中。


软件版本说明:

hadoop版本:1.1.2

fluentd版本:1.1.21


测试环境说明:

node29服务器上安装了apache,以及fluentd,作为fluentd的客户端;

node1服务器,为hadoop服务器的namenode;


node29服务器上fluentd配置文件:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
< source >
   type  tail
   format  apache2
   path  /var/log/httpd/access_log
   pos_file  /var/log/td-agent/access_log .pos
   time_format %Y-%m-%d %H:%M:%S
   localtime
   tag apache.access
  
< /source >
 
#Log Forwarding to node1 server
<match apache.access>
   type  forward
#  time_slice_format %Y%m%d
#  time_slice_wait 10m
#  localtime
  
#定义日志入库日志的时间;
   time_format %Y-%m-%d %H:%M:%S
#localtime非常重要,不设置日志时间和系统时间相差8小时;  
   localtime
  
#定义入库日志的时间;
  
   <server>
   host node1
   port 24224
   < /server >
  
   flush_interval 1s
< /match >


node1服务器配置,这个服务器上配置了hadoop的namenode,以及作为fluentd的转发角色,具体配置文件如下:

1
2
3
4
< source >
   type  forward
   port 24224
< /source >


<match apache.access>

  type webhdfs

  host node1.test.com

  port 50070

  path /apache/%Y%m%d_%H/access.log.${hostname}

  time_slice_format %Y%m%d

  time_slice_wait 10m


#定义日志入库日志的时间;

  time_format %Y-%m-%d %H:%M:%S

  localtime


  flush_interval 1s

</match>


配置好以后,重启fluentd服务;


开始测试,在node29用ab命令开始访问apache,生成访问日志;

wKioL1Srm8vR_ovaAAPZIkcRXtw457.jpg



然后,到node1服务器上去查看HDFS文件系统中,是否生成了相关文件及目录:

查看生成的目录:

wKioL1SrnD2T4tjMAANsBMDhnlw258.jpg


查看文件里面具体日志:

hadoop fs -cat /apache/20150106_16/access.log.node1.test.com

wKiom1Srm-KBfz8qAAYjJTfE3zY387.jpg


如上图所示,fluentd已经通过转发模式,把node29服务器上apache日志收集到hdfs文件系统中了,方便下一步用hadoop进行离线分析。




本文转自 shine_forever 51CTO博客,原文链接:http://blog.51cto.com/shineforever/1599771

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
23天前
|
调度
【嵌入式开源库】timeslice的使用,完全解耦的时间片轮询框架构(二)
【嵌入式开源库】timeslice的使用,完全解耦的时间片轮询框架构
|
1月前
|
监控 Serverless 数据库
Serverless 应用引擎常见问题之biphon-education-配置了SLS后一直重启如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
28 5
|
1月前
|
Java 开发者 微服务
Java企业应用软件系统架构演变史
Java企业应用软件系统架构演变史
28 0
|
1月前
|
网络协议 Linux
Linux DNS服务详解——DNS主从架构配置
Linux DNS服务详解——DNS主从架构配置
407 4
|
1月前
|
存储 JSON 监控
可以通过配置Filebeat来将Higress日志持久化到磁盘
【2月更文挑战第10天】可以通过配置Filebeat来将Higress日志持久化到磁盘
28 4
|
2月前
|
Java
flume的log4j.properties配置说明
flume的log4j.properties配置说明
|
2天前
|
Java
log4j异常日志过滤规则配置
log4j异常日志过滤规则配置
11 0
|
14天前
|
存储 程序员 数据处理
软件体系结构 - 冯·诺依曼架构
软件体系结构 - 冯·诺依曼架构
36 0
|
17天前
|
前端开发 安全 JavaScript
计算机软件从 CS 模式到 BS 架构迁移背后的动因
计算机软件从 CS 模式到 BS 架构迁移背后的动因
21 0
|
23天前
|
程序员 Linux
【嵌入式开源库】timeslice的使用,完全解耦的时间片轮询框架构(三)
【嵌入式开源库】timeslice的使用,完全解耦的时间片轮询框架构

热门文章

最新文章