Oozie相当于Hadoop的一个客户端,因此集群中要有一台机器部署Oozie server端即可,由于可以有任意多个客户端连接Oozie,故每个客户端都必须部署Oozie client。
比如我的机器有hadoopmaster、hadoopslave1、hadoopslave2。
比如我的机器有sparkmaster、sparkslave1、sparkslave2。
比如我的机器有master、slave1、slave2。
比如我的机器有bigdatamaster、bigdataslave1、bigdataslave2
建议:
一般,我们在master上部署Oozie server,在slave1或者slave2上部署Oozie client。
Oozie支持手工和工具两种部署方式
(1)手工部署Oozie呢,需配置太多参数,但是,好理解其原理,建议初学这样做,能学到很多。该方式啊,均得由用户执行,细节太多,切当设计多个组件时,用户须自己解决组件间版本兼容问题。(这里,我就不赘述了,可以见Azkaban)。
因为,现在都是用这个优秀的第三方工作流引擎。
(2)工具部署Oozie呢,比如Ambari或Cloudera Manger。(当前两大最主流的集群管理工具,前者是Hortonworks公司,后者是Cloudera公司)使用工具来,可以说是一键操作,难点都在工具Ambari或Cloudera Manger本身部署上。
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6118020.html,如需转载请自行联系原作者