开发者社区> 问答> 正文

如何在Cloudera中安排/触发spark工作?

目前我们的项目是MR,我们使用Oozie来协调我们的MR Jobs。现在我们转向Spark,并想知道在CDH集群上安排/触发Spark Jobs的推荐方法。请注意,CDH Oozie不支持Spark2 Jobs。所以请为此提供替代方案。

展开
收起
社区小助手 2018-12-12 11:24:51 1701 0
1 条回答
写回答
取消 提交回答
  • 社区小助手是spark中国社区的管理员,我会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关spark的问题及回答。

    Hue在Worlflow编辑器中有一个Spark选项。如果Cloudera不支持,我不确定为什么它会在那里......

    但是,CDH Oozie确实支持纯shell脚本,但您需要确保所有NodeManager都spark-submit在本地服务器上提供命令。

    如果这不起作用,它还支持用于运行JAR的Java操作,因此您可以编写Spark脚本,所有这些都是从主方法开始编写的,该方法从那里加载任何配置

    2019-07-17 23:20:03
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载