开源日志收集 肿么选型??

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 开源日志收集 肿么选型??

开源日志收集 肿么选型??


企业无论是已经使用了开源日志收集工具,还是准备选择一款或多款工具,都有必要了解日志收集工具的关键要求。这些要求包括:高数据吞吐量、可靠性、可扩展性、灵活性、安全性以及资源(CPU 和内存)消耗等。本文讨论了市面上流行的几款日志收集工具(包括 Logstash、Fluentd、Fluent Bit 和 Vector)及其主要特点。

1. Logstash

Logstash 是最受欢迎的日志收集工具之一,它是 ELK(Elasticsearch/Logstash/Kibana)架构的一部分。

Logstash 的主要优势:

● 处理结构化数据和非结构化数据。

● 支持更高的数据安全性,能够匿名化或排除敏感字段。

● 支持数百个插件,包括输入、过滤和输出等插件。过滤器插件执行日志处理,比如聚合和解析。

虽然 Logstash 是一款可靠的日志收集工具,在处理日志数据方面有诸多选项,但如果内存占用量小是个关键要求,本文介绍的其他日志收集工具可能更胜一筹。因为 Logstash 是用 Java 编写的,所以需要 JVM 支持。如果企业打算从嵌入式设备和物联网应用程序收集日志,它不是最佳选择。

2. Fluentd

Fluentd 是一款日志收集工具,内存占用量小,可以处理各种日志源和目的地。许多受支持的插件允许连接到多种类型的日志源和目的地。与其他日志收集工具一样,Fluentd 的典型日志源包括应用程序、基础设施和消息队列平台,而通常目的地是日志管理工具和存储归档系统。

Fluentd 的主要优势:

● 支持许多日志源和目的地。

● 灵活、可扩展的解析选项,支持多种输入格式。

● 拥有庞大的生态系统,包括成百上千个插件,以及用 Ruby 自行编写插件的功能。

● 支持 Apache 许可证,版本 2.0。

● 供应商中立(CNCF 项目)。

如果企业需要中立的供应商,Fluentd 是不错的选择。它还经常与 Kubernetes 和容器化环境一起使用。

3. Fluent Bit

Fluent Bit 不仅是一款日志收集工具,还可以用作数据流处理工具,并充当将日志数据转发到 Fluentd 的运送工具。Fluent Bit 在 Kubernetes 集群等容器化环境中运行顺畅。Fluent Bit 可以扩展并仍能节省资源,因为它占用的空间很小。虽然 Fluent Bit 经常用在 Kubernetes 环境中,但它也可以部署在裸机服务器、虚拟机和嵌入式设备上。

Fluent Bit 的主要优势:

● 轻量级设计,内存占用量极小(通常不到 1MB)。

● 易于扩展的架构。

● 可插入式架构,有许多输入、过滤器和输出插件。

● 支持基于指标和基于日志的有效负载。

● 支持通过安全的连接将日志发送到存储后端。

● 使用 SQL,支持数据流处理。

● 支持 Apache 许可证,版本 2.0。

● 供应商中立(CNCF 项目)。

Fluent Bit 从众多日志源收集日志和指标,并将它们发送到不同的目的地。Fluent Bit 真正大放异彩的地方在于嵌入式、边缘及其他资源受限的环境,因为精简的运行时环境结合众多的输入/输出选项至关重要。

4. Vector

Vector 是一款高性能的日志收集工具。与本文中的其他日志收集工具相比,这款产品比较新。

Vector 的主要优势:

● 高效的内存/CPU 消耗和高数据吞吐量。

● 良好的可靠性,正确性和交付方面有保证。

● 包括自定义 DSL,以一种安全、高性能的方式动态转换数据。

● 支持基于指标和日志的有效负载。

● 大量的输入和输出集成。

● 可以部署为代理或聚合器。

由于广泛的部署选项、同时支持指标和日志以及可用集成的数量,使 Vector 成为一种出色而灵活的选择。由于 Vector 用 Rust 编写,提供了内存安全和效率保证,使其在其他现有工具中独树一帜。Vector 引入了单元测试框架,可以更轻松地维护复杂的日志收集工具拓扑。

此外,Vector 的软件组件竭力为传送到目的地的日志和事件提供交付保证。Vector 的用户还可以获得 Vector 组件的代码总体稳定性方面的保证。无论在新环境中还是在旧环境中工作,它都值得认真考虑。

结 语

很难判定哪一款工具主导市场,企业选择合适的日志收集工具取决于其特定需求和要求。比如说,如果企业在为需要资源消耗少的物联网应用程序寻找日志收集工具,那么最好使用 Vector 或 Fluent Bit,而不是 Logstash。如果企业看重供应商的中立性,CNCF 支持的项目(比如 Fluentd 和 Fluent Bit)倒是不错的选择。仔细检查性能、资源消耗、支持众多输入和输出格式的灵活性、可扩展性、可靠性、供应商锁定和安全要求,可以帮助企业找到适合的日志收集工具。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
8月前
|
存储
优秀开源日志平台GrayLog5.0一键安装脚本
优秀开源日志平台GrayLog5.0一键安装脚本
238 0
|
8月前
|
Prometheus Cloud Native 数据库
Grafana 系列文章(九):开源云原生日志解决方案 Loki 简介
Grafana 系列文章(九):开源云原生日志解决方案 Loki 简介
|
11天前
|
人工智能 监控 算法
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
3D-Speaker是阿里巴巴通义实验室推出的多模态说话人识别开源项目,结合声学、语义和视觉信息,提供高精度的说话人识别和语种识别功能。项目包含工业级模型、训练和推理代码,以及大规模多设备、多距离、多方言的数据集,适用于多种应用场景。
112 18
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
|
8天前
|
人工智能 算法 数据挖掘
开源更新|通义3D-Speaker多说话人日志功能
开源更新|通义3D-Speaker多说话人日志功能
|
3月前
|
Web App开发 存储 监控
iLogtail 开源两周年:UC 工程师分享日志查询服务建设实践案例
本文为 iLogtail 开源两周年的实践案例分享,讨论了 iLogtail 作为日志采集工具的优势,包括它在性能上超越 Filebeat 的能力,并通过一系列优化解决了在生产环境中替换 Filebeat 和 Logstash 时遇到的挑战。
145 15
|
2月前
|
存储 运维 监控
开源日志Graylog
【10月更文挑战第21天】
223 8
|
2月前
|
存储 监控 安全
|
2月前
|
存储 数据采集 监控
开源日志Fluentd
【10月更文挑战第21天】
50 7
|
2月前
|
存储 数据采集 监控
开源日志分析Elasticsearch
【10月更文挑战第22天】
50 5
|
2月前
|
机器学习/深度学习 运维 监控
开源日志分析Kibana
【10月更文挑战第22天】
51 3