文档备案控制台

开发者社区问答正文

有没有办法在不同的服务器上运行master提交spark作业

如何重命名scala数据框中的列标题
我们需要安排spark工作，因为我们熟悉apache-airflow，我们希望继续创建不同的工作流程。我搜索了网络，但没有找到如何使用Apache Airflow在不同的服务器运行主机上运行spark。

展开

收起

社区小助手 2018-12-12 18:26:26 2562 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

有三种方法可以远程使用Apache Airflow提交Spark作业：
（1）使用SparkSubmitOperator：此运算符期望您在我们的Airflow服务器上设置spark-submit二进制和YARN客户端配置。它使用给定的选项调用spark-submit命令，阻塞直到作业完成并返回最终状态。好消息是，它还从spark-submit命令stdout和stderr中流式传输日志。
我相信你真的只需要配置一个yarn-site.xml文件，以便spark-submit --master yarn --deploy-mode客户端工作。
在YARN中部署Application Master后，Spark将在本地运行到Hadoop集群。
如果你真的想要，你可以添加一个hdfs-site.xml并hive-site.xml从Airflow提交（如果可能的话），但是否则至少hdfs-site.xml应该从YARN容器类路径中提取文件
（2）使用SSHOperator：使用此运算符在远程服务器上运行bash命令（使用SSH协议通过paramiko库）spark-submit。这种方法的好处是您不需要复制hdfs-site.xml或维护任何文件。
（3）与Livy一起使用SimpleHTTPOperator：Livy是一个开源的REST接口，可以从任何地方与Apache Spark进行交互。您只需要进行REST调用。

2019-07-17 23:20:16

赞同展开评论

问答分类：

分布式计算 Apache Scala Spark

问答标签：

云服务器 ECS运行 apache spark作业云服务器 ECS作业服务器apache spark 云服务器 ECS spark

问答地址：

开发者社区 > 大数据 > 问答

相关问答

flink里pyspark ,通过 spark-submit 这种方式提交作业，报错依赖缺失咋办？

212

1

0

接入阿里云RSS后，小米Spark作业的稳定性和性能有哪些显著提升？

193

1

0

阿里云E-MapReduce在 SPARK 任務在不知道 EMR master ip addres

349

2

0

云数据仓库ADB 单击作业开发 > Spark Jar开发。找不到这个菜单

126

1

0

云服务器手机远程控制界面不能缩小有什么办法吗

206

1

0

MaxCompute spark作业报错Class org.apache.hadoop.fs....

353

1

0

在ECS部署的airflow如何将spark作业提交到E-MapReduce集群上

138

1

0

E-MapReduce使用spark-submit提交spark作业偶尔报错日志中的关键信息为...

126

1

0

E-MapReduce Spark历史作业在哪里可以查看到

131

0

0

阿里云如何才能跟私有服务器建立联系？

1370

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云如何部署使用OpenClaw？OpenClaw部署一看就会：零基础零代码、纯点击

阿里云ECS 手动部署 OpenClaw 超详细教程（2026最新版）

2026年阿里云新老用户如何部署OpenClaw？OpenClaw部署喂饭级教程

在今天3点左右通义灵码问问题不正常返回了

OpenClaw安装贵吗？2026年阿里云部署成功OpenClaw（Clawdbot）成本是多少？

相关文章

Spark SQL练习1-电商用户行为分析

Spark SQL练习2-电商用户行为分析

2026阿里云免费版SSL证书申请流程，跟着教程一步步，非常简单！

phpstudy_x64_8.1.1.3安装教程（含Apache/MySQL启动与端口修改）

2026阿里云免费SSL证书申请流程｜零基础一步到位，超简单

还有其他疑问?