YARN HA架构部署测试-阿里云开发者社区

YARN HA架构部署测试

2018-02-26 1193

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ResourceManager(RM)负责跟踪集群中的资源，并调度应用程序(例如MapReduce作业)。在Hadoop 2.4之前，ResourceManager是纱线集群中的单一故障点。

ResourceManager(RM)负责跟踪集群中的资源，并调度应用程序(例如MapReduce作业)。
在Hadoop 2.4之前，ResourceManager是纱线集群中的单一故障点。
高可用性特性以活动/备用资源管理器对的形式添加冗余，以删除此故障点。

原理图

配置过程

管理命令

ResourceManger Restart

NodeManagers和客户端在RM关闭期间将保持对RM的轮询，直到RM启动。当启动后，RM将通过心跳机制向正在与其会话的NodeManager和
ApplicationMasters发送同步指令。目前NodeManager和ApplicationMaster 处理该指令的方式为：NodeManager将杀死它管理的所有容器然后向RM 重新注册，对于RM来说，这些重新注册的NodeManager与新加入的
NodeManager相似。ApplicationMasters在接收到RM的同步指令后，将会关闭。在RM重启后，从状态存储中加载应用元数据和认证信息并放入内存后，RM将为每个还未完成的应用创建新的尝试。正如之前描述的
，此种方式下之前正在运行的应用程序的工作将会丢失，因为它们已经被RM在重启后使用同步指令杀死了

ResourceManager重启可以划分为两个阶段。

第一阶段，
增强的ResourceManager（RM）将应用程序的状态和其它认证信息保存到一个插入式的状态存储中。
RM重启时将从状态存储中重新加载这些信息，然后重新开始之前正在运行的应用程序，用户不需要重新提交应用程序。
第二阶段，
重启时通过从NodeManagers读取容器的状态和从ApplicationMasters读取容器的请求，集中重构RM的运行状态。与第一阶段不同的是，在第二阶段中，之前正在运行的应用程序将不会在RM重启后被杀死，所以应用程序不会因为RM中断而丢失工作。

YARN HA架构部署测试

原理图

配置过程

管理命令

ResourceManger Restart

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

YARN HA架构部署测试

原理图

配置过程

管理命令

ResourceManger Restart

热门文章

最新文章

相关课程

相关电子书