《Flume日志收集与MapReduce模式》一1.1　Flume 0.9-阿里云开发者社区

《Flume日志收集与MapReduce模式》一1.1　Flume 0.9

2017-05-02 1103

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

简介：

本节书摘来自华章出版社《Flume日志收集与MapReduce模式》一书中的第1章，第1.1节，作者［美］史蒂夫·霍夫曼（Steve Hoffman）斯里纳特·佩雷拉（Srinath Perera），更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.1　Flume 0.9

Flume是在2011年被首次引入到Cloudera的CDH3分发中的。它由一套工作守护进程（代理）构成，这些守护进程是通过Zookeeper（一个配置与协调系统）根据一个或多个集中的Master配置而成的。在Master上，你可以在Web UI中查看代理状态，也可以以集中的方式在UI或是通过命令行Shell的方式取出配置（这两种方式都是通过Zookeeper与工作代理进行通信的）。
可以通过3种模式发送数据，分别叫作Best Effort（BE）、Disk Failover（DFO）以及End-to-End（E2E）。Masters用于E2E模式，而多个Master配置尚不成熟，因此通常情况下只会使用一个Master，这使得其成为了E2E数据流失败的主要原因。Best Effort见名知意，代理会尝试并发送数据，如果无法发送，那么数据就会被丢弃。这种模式非常适合于度量等场景，一些差异是可以被接受的，因为新数据很快就会到来。DiskFailover模式会将无法发送的数据存储到本地磁盘上（有时也存储到本地数据库中），并且会不断重试，直到可以将数据发送到数据流中的下一个接受者为止。这对于计划好（或计划外）的断电场景很方便，只要有足够的本地磁盘能够缓存负载即可。
2011年6月，Cloudera将Flume项目的控制权交给了Apache基金会。2012年，Flume项目就从孵化状态变成了顶级项目。在孵化的这一年中，开发人员就已经开始基于Star Trek Themed标签对Flume进行重构，并创建了Flume-NG（Flume the Next Generation）。

《Flume日志收集与MapReduce模式》一1.1　Flume 0.9

1.1　Flume 0.9

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

《Flume日志收集与MapReduce模式》一1.1 Flume 0.9

1.1 Flume 0.9

热门文章

最新文章

相关课程

相关电子书

相关实验场景

《Flume日志收集与MapReduce模式》一1.1　Flume 0.9

1.1　Flume 0.9