文档备案控制台

开发者社区问答正文

Spark运行模式流程中的Yarn-Cluster模式流程是什么？

Spark运行模式流程中的Yarn-Cluster模式流程是什么？

展开

收起

芯在这 2021-12-06 15:55:07 393 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

流程说明如下：

Spark Yarn Client向YARN中提交应用程序，包括ApplicationMaster程序、启动ApplicationMaster的命令、需要在Executor中运行的程序等；

ResourceManager收到请求后，在集群中选择一个NodeManager，为该应用程序分配第一个Container，要求它在这个Container中启动应用程序的ApplicationMaster，其中ApplicationMaster进行SparkContext等的初始化；

ApplicationMaster向ResourceManager注册，这样用户可以直接通过ResourceManage查看应用程序的运行状态，然后它将采用轮询的方式通过RPC协议为各个任务申请资源，并监控它们的运行状态直到运行结束；

一旦ApplicationMaster申请到资源（也就是Container）后，便与对应的NodeManager通信，要求它在获得的Container中启动CoarseGrainedExecutorBackend，CoarseGrainedExecutorBackend启动后会向ApplicationMaster中的SparkContext注册并申请Task。这一点和Standalone模式一样，只不过SparkContext在Spark Application中初始化时，使用CoarseGrainedSchedulerBackend配合YarnClusterScheduler进行任务的调度，其中YarnClusterScheduler只是对TaskSchedulerImpl的一个简单包装，增加了对Executor的等待逻辑等；

ApplicationMaster中的SparkContext分配Task给CoarseGrainedExecutorBackend执行，CoarseGrainedExecutorBackend运行Task并向ApplicationMaster汇报运行的状态和进度，以让ApplicationMaster随时掌握各个任务的运行状态，从而可以在任务失败时重新启动任务；

应用程序运行完成后，ApplicationMaster向ResourceManager申请注销并关闭自己；

2021-12-06 15:57:17

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark yarn apache spark运行 apache spark流程 apache spark模式运行Yarn

问答地址：

开发者社区 > 大数据 > 问答

相关问答

大数据计算MaxCompute Spark可以支持yarn client模式吗？

142

1

0

dataworks部分定时任务显示任务异常退出，但是上yarn上显示任务运行成功这个是什么原因呢？

147

1

0

大数据计算MaxCompute在idea下的Local模式下运行Spark，报错怎么排查这个问题啊？

300

5

0

请问FLINK-SQL作业sql文件怎样能运行 yarn-application 模式?

270

1

0

flink cdc 为啥我从2.4升到3.1.1，在yarn上运行会有问题?

175

0

0

flink sql-client.sh yarn-per-job 运行完成后不退出

311

0

0

在供应链核算的Spark处理流程中，主要包含哪些主流程？

69

1

0

在client模式下，如果spark job的jar包过大，可能会导致什么问题？如何解决？

200

1

0

Spark的RDD和DataFrame编程模式如何帮助提升核算效率？

117

1

0

flink on yarn打包运行，使用per job运行就没有问题，为什么？

154

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

相关文章

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（92）如何方便快速地通过SQL取数实现定制化数据同步

阿里云第九代ECS云服务器（c9i、g9i、r9i）CPU采用Intel® Xeon® Granite Rapids处理器，主频3.2 GHz

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

还有其他疑问?