日志采集场景下客户端测评
DT时代,数以亿万计的服务器、移动终端、网络设备每天产生海量的日志。中心化的日志处理方案有效地解决了在完整生命周期内对日志的消费需求,而日志从设备采集上云是始于足下的第一步。
三款日志采集工具
Logstash开源界鼎鼎大名ELK stack中的”L”,社区活跃,生态圈提供大量插件支持- Logstash基于JRuby实现,可以跨平台运行在JVM上
- 模块化设计,有很强的扩展性和互操作性。
Fluentd
- 开源社区中流行的日志采集工具,td-agent是其商业化版本,由Treasure Data公司维护,是本文选用的评测版本。
- Fluentd基于CRuby实现,并对性能表现关键的一些组件用C语言重新实现,整体性能不错。
- Fluentd设计简洁,pipeline内数据传递可靠性高
- 相较于Logstash,其插件支持相对少一些。
Logtail
- 阿里云日志服务的生产者,经过3年多阿里集团大数据场景考验
- 采用C++语言实现,对稳定性、资源控制、管理等下过很大的功夫,性能良好
- 相比于Logstash、Fluentd的社区支持,Logtail功能较为单一,专注日志采集功能。
功能对比
日志文件采集场景 - 性能对比
日志样例:以Nginx的access log为样例,如下一条日志365字节,结构化成14个字段:
在接下来的测试中,将模拟不同的压力将该日志重复写入文件,每条日志的time字段取当前系统时间,其它13个字段相同。
相比于实际场景,模拟场景在日志解析上并无差异,有一点区别是:较高的数据压缩率会减少网络写出流量。
Logstash
logstash-2.0.0版本,通过grok解析日志并写出到kafka(内置插件,开启gzip压缩)。
日志解析配置:
测试结果:
Fluentd
td-agent-2.2.1版本,通过正则表达式解析日志并写入kafka(第三方插件fluent-plugin-kafka,开启gzip压缩)。
日志解析配置:
测试结果:
注:受GIL限制,Fluentd单进程最多使用1个cpu核心,可以使用插件multiprocess以多进程的形式支持更大的日志吞吐。
Logtail
logtail 0.9.4版本,设置正则表达式进行日志结构化,数据LZ4压缩后以HTTP协议写到阿里云日志服务,设置batch_size为4000条。
日志解析配置:
测试结果:
单核处理能力对比
总结
可以看到三款日志工具各有特点:
- Logstash支持所有主流日志类型,插件支持最丰富,可以灵活DIY,但性能较差,JVM容易导致内存使用量高。
- Fluentd支持所有主流日志类型,插件支持较多,性能表现较好。
- Logtail占用机器CPU/内存资源最少,性能吞吐量较好,针对常用日志场景支持全面,但缺少插件等机制,灵活性和可扩展性不如以上两个客户端。