kafka日志写入logstash

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: kafka日志写入logstash

Logstash 是免费且开放的服务器端数据处理管道,能够从多个来源采集数据,转换数据,然后将数据发送到您最喜欢的“存储库”中

Logstash 是一个开源数据收集引擎,具有实时流水线功能。Logstash 可以动态统一来自不同来源的数据,并将数据规范化为您选择的目的地。为各种高级下游分析和可视化用例清理和民主化您的所有数据。

basic_logstash_pipeline.png

安装 Logstash

从下载的二进制文件安装

Logstash 二进制文件可从 https://www.elastic.co/cn/downloads/logstash

下载适用于您的主机环境的 Logstash 安装文件 - TARG.GZ、DEB、ZIP 或 RPM。

启动logstash

从控制台进行测试
输入 stdin 输出 stdout

cd logstash-7.13.4 
./bin/logstash -e 'input { stdin { } } output { stdout {} }'

此时控制台作为输入流输入任何内容回车,输出流会输出到控制台。

指定配置文件

通过 -f 指定配置文件
通过 --config.reload.automatic 自动重新加载配置文件

bin/logstash -f first-pipeline.conf --config.reload.automatic

配置文件主要有3部分 input filter output

Codec plugins

codec插件可以在input、output流中处理数据,更改数据格式。

常用的codec有

  • json 读取 JSON 格式的内容,为 JSON 数组中的每个元素创建一个事件
  • json_lines 读取以换行符分隔的 JSON
  • plain 读取纯文本,事件之间没有分隔
  • mutiline 将多行消息合并为一个事件

将kafka日志消息输入到logstash

topics指定监听的topic
json将消息转为json格式

input {
  kafka {
    id => "my_plugin_id"
    bootstrap_servers => "localhost:9092"
    topics => ["logger-channel"]
    auto_offset_reset => "latest"
  }
}

filter {
  #json
    json {
        source => "message"
    }
    date {
        match => ["time", "yyyy-MM-dd HH:mm:ss.SSS"]
        remove_field => ["time"]
    }
}

output {
  stdout {}
}

启动服务

./bin/logstash -f ./config/kafka-std.conf --config.reload.automatic

控制台接收到kafka的日志消息

{
        "logger" => "com.paw.kafka.elk.controller.KafkaLogController",
      "@version" => 1,
        "thread" => "http-nio-8080-exec-7",
      "levelVal" => 20000,
    "@timestamp" => 2021-08-01T07:10:27.273Z,
       "appName" => "paw-kelk",
       "message" => "cost time: 23",
           "env" => "dev",
        "caller" => {
          "file" => "KafkaLogController.java",
        "method" => "kafka",
         "class" => "com.paw.kafka.elk.controller.KafkaLogController",
          "line" => 35
    },
         "level" => "INFO"
}
{
        "logger" => "com.paw.kafka.elk.controller.KafkaLogController",
      "@version" => 1,
        "thread" => "http-nio-8080-exec-7",
      "levelVal" => 10000,
    "@timestamp" => 2021-08-01T07:10:27.273Z,
       "appName" => "paw-kelk",
       "message" => "debug time: 23",
           "env" => "dev",
        "caller" => {
          "file" => "KafkaLogController.java",
        "method" => "kafka",
         "class" => "com.paw.kafka.elk.controller.KafkaLogController",
          "line" => 36
    },
         "level" => "DEBUG"
}

至此kafka日志写入logstash完成。logsstash作为kafka日志topic的一个消费端,kafka将日志发往logstash,logtash以输入流方式结束日志数据,经过filter加工处理输出到输出流如elasticsearch中。

相关文章
|
10月前
|
存储 监控 安全
|
10月前
|
存储 JSON 监控
开源日志分析Logstash
【10月更文挑战第22天】
219 1
|
11月前
|
存储 消息中间件 大数据
大数据-69 Kafka 高级特性 物理存储 实机查看分析 日志存储一篇详解
大数据-69 Kafka 高级特性 物理存储 实机查看分析 日志存储一篇详解
206 4
|
11月前
|
存储 消息中间件 大数据
大数据-70 Kafka 高级特性 物理存储 日志存储 日志清理: 日志删除与日志压缩
大数据-70 Kafka 高级特性 物理存储 日志存储 日志清理: 日志删除与日志压缩
151 1
|
11月前
|
存储 消息中间件 大数据
大数据-68 Kafka 高级特性 物理存储 日志存储概述
大数据-68 Kafka 高级特性 物理存储 日志存储概述
94 1
|
12月前
|
消息中间件 Kafka API
python之kafka日志
python之kafka日志
138 3
|
消息中间件 存储 监控
Kafka的logs目录下的文件都是什么日志?
Kafka的logs目录下的文件都是什么日志?
677 11
|
消息中间件 Java Kafka
【Azure 事件中心】开启 Apache Flink 制造者 Producer 示例代码中的日志输出 (连接 Azure Event Hub Kafka 终结点)
【Azure 事件中心】开启 Apache Flink 制造者 Producer 示例代码中的日志输出 (连接 Azure Event Hub Kafka 终结点)
109 0
|
8月前
|
消息中间件 存储 缓存
kafka 的数据是放在磁盘上还是内存上,为什么速度会快?
Kafka的数据存储机制通过将数据同时写入磁盘和内存,确保高吞吐量与持久性。其日志文件按主题和分区组织,使用预写日志(WAL)保证数据持久性,并借助操作系统的页缓存加速读取。Kafka采用顺序I/O、零拷贝技术和批量处理优化性能,支持分区分段以实现并行处理。示例代码展示了如何使用KafkaProducer发送消息。
|
11月前
|
消息中间件 存储 运维
为什么说Kafka还不是完美的实时数据通道
【10月更文挑战第19天】Kafka 虽然作为数据通道被广泛应用,但在实时性、数据一致性、性能及管理方面存在局限。数据延迟受消息堆积和分区再平衡影响;数据一致性难以达到恰好一次;性能瓶颈在于网络和磁盘I/O;管理复杂性涉及集群配置与版本升级。
377 1