logstash 7.6.2 基础教程

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS MySQL,高可用系列 2核4GB
简介: logstash 7.6.2 基础教程

正文


一、简单介绍


logstash是一个数据同步工具,一般是在ELK(Elasticsearch + Logstash + Kibana)技术栈解决数据同步问题,通过logstash将mysql、日志文件、redis等数据源的数据同步到ES,通过ES搜索数据。


二、基本语法


1.配置文件格式


# 输入插件配置,主要配置需要同步数据源,如mysql
input {
}
# 过滤器插件配置,主要用于数据进行过滤,格式化操作,filter是可选的
filter {
}
# 输出插件配置,主要配置同步数据的地址,如同步到es
output{
}


2.日志同步到es例子


input {
        tcp {
            port => 5044
            codec => json_lines
       }
}
output {
     elasticsearch {
          hosts => ["127.0.0.1:9200"]
          index => "laokou-%{+YYYY.MM.dd}"
          stdout { codec => rubydebug } #stdout控制台打印 stdin控制台输入
      }
}


3.基本流程(logstash处理流程,就像一条管道,数据从管道一端流向另一端)


datasources(redis/mysql/日志文件) > inputs > filters > outputs > elasticsearch


inputs:负责收集数据(常见数据源 redis/kafka/rabbitmq/mysql/file/ filebeat 轻量级文件数据采集器)


filters:对收集到的数据进行格式化、过滤、简单的数据处理(grok 格式化文本内容    drop 丢弃一些数据)


outputs:负责数据同步到目的地(目的地 elasticsearch/file )


codesc:编码器,对数据进行序列化处理,主要就是json和文本两种编码器


相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
目录
相关文章
|
数据建模 计算机视觉
SiMBA:基于Mamba的跨图像和多元时间序列的预测模型
微软研究者提出了SiMBA,一种融合Mamba与EinFFT的新架构,用于高效处理图像和时间序列。SiMBA解决了Mamba在大型网络中的不稳定性,结合了卷积、Transformer、频谱方法和状态空间模型的优点。在ImageNet 1K上表现优越,达到84.0%的Top-1准确率,并在多变量长期预测中超越SOTA,降低了MSE和MAE。代码开源,适用于复杂任务的高性能建模。[[论文链接]](https//avoid.overfit.cn/post/c21aa5ca480b47198ee3daefdc7254bb)
2044 3
|
机器学习/深度学习 Ruby
YOLOv5改进 | 2023注意力篇 | iRMB倒置残差块注意力机制(轻量化注意力机制)
YOLOv5改进 | 2023注意力篇 | iRMB倒置残差块注意力机制(轻量化注意力机制)
645 0
cron-utils获取下几次执行时间
cron-utils获取下几次执行时间
448 0
|
Java
filebeat占用文件句柄磁盘满
filebeat作为日志采集客户端,相比较于java编写的fluent,有着低功耗的特性。但在一些极端情况下,忽视filebeat的一些特性配置,可能会带来灾难。之前发过一篇关于filebeat内存占用的案例和分析,今天再说下filebeat占用文件句柄、耗费主机磁盘甚至导致磁盘满的案例。
9504 0
|
消息中间件 JavaScript 小程序
SpringBoot 实现 MySQL 百万级数据量导出并避免 OOM 的解决方案
SpringBoot 实现 MySQL 百万级数据量导出并避免 OOM 的解决方案
|
网络协议 Linux
CentOS7 yum安装报错“Could not resolve host: mirrorlist.centos.org;"之解决办法(换源)
CentOS7 yum安装报错“Could not resolve host: mirrorlist.centos.org; Name or service not known“之解决办法(换源)
|
10月前
|
机器学习/深度学习 供应链 搜索推荐
优化销售预测:6种模型适用的场景与实战案例
不同行业的销售预测采用什么模型比较好?3分钟了解6种销售预测模型,以及适用行业场景。
2724 2
优化销售预测:6种模型适用的场景与实战案例
|
编解码 搜索推荐 API
通义万相文本绘图与人像美化解决方案体验与评估
通义万相提供详尽文档和简易API调用,适合新手部署。服务集成便捷,响应迅速,模型泛化能力强,支持多样化风格,生成图片质量高。建议增强交互式编辑、多语言支持及智能推荐功能。相比竞品,通义万相成本控制优秀,易用性强,适用范围广泛。
481 8
|
12月前
|
数据采集 Python
数据爬取技术进阶:从表单提交到页面点击的实现
本文介绍了如何使用 Python 和代理 IP 技术,从表单提交到页面点击,实现动态网页的数据爬取。以百度贴吧为例,详细讲解了登录、发帖和数据采集的实现流程,并提供了完整的代码示例。通过代理 IP 确保数据获取的稳定性和安全性。
388 3
|
Web App开发 缓存 文字识别
scrapy_selenium的常见问题和解决方案
scrapy_selenium是一个结合了scrapy和selenium的库,可以让我们使用selenium的webdriver来控制浏览器进行动态网页的爬取。但是在使用scrapy_selenium的过程中,我们可能会遇到一些问题,比如如何设置代理、如何处理反爬、如何优化性能等。本文将介绍一些scrapy_selenium的常见问题和解决方案,希望对你有所帮助。
616 0
scrapy_selenium的常见问题和解决方案