开发者社区> 问答> 正文

Apache适用于AWS EMR集群的最佳Airflow架构是什么?

我有一个带有1个主节点,30个核心节点和一些自动缩放任务节点的AWS EMR集群。现在,Oozie正在群集上运行数百个Hive和mysql作业。我将把一些工作从Oozie换成Airflow。我用谷歌搜索将Airflow应用于集群。我发现所有dag应该位于每个节点上,并且必须在所有节点上安装Airflow Worker。但是,我的dag将被频繁更新,新的dag将被频繁添加,但是节点的数量大约为100,甚至使用了自动缩放的节点。而且,如您所知,只有主节点在群集上具有hive / mysql应用程序。所以我很困惑。谁能告诉我将气流架构应用于我的EMR集群?

展开
收起
被纵养的懒猫 2019-09-24 20:17:33 965 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
生命密码-基因数据的EMR实践 立即下载
超大规模机器学习在EMR的实践 立即下载
EMR弹性低成本离线大数据分析最佳实践 立即下载

相关镜像