开发者社区> 问答> 正文

E-MapReduce集群规划 实例类型是什么?


EMR集群中由多个不同的节点实例类型组成,他们分别是主实例节点(Master),核心实例节点(Core)和计算实例节点(Task),每一种不同的实例在部署的时候会部署完全不同的服务进程,以完成完全不同的任务。举例来说,我们会在主实例节点(Master)上部署Hadoop HDFS 的 Namenode 服务,Hadoop YARN 的 ResourceManager 服务,而在核心实例节点(Core)上部署Datanode 服务,Hadoop YARN 的 NodeManager 服务,在计算实例节点(Task)顾名思义,只进行计算,部署 Hadoop YARN的 NodeManager 服务,不部署任何 HDFS 相关的服务。
在创建集群的时候需要确定对应的三种实例类型的 ECS 规格,相同实例类型的 ECS在同一个实例组内。并且可以在后期通过扩容来扩容对应实例组内的机器数量(主实例组除外)。
注意:计算实例节点(Task)从3.2.0及以后版本开始支持

[font='iconfont'] Master 主实例


主实例是集群服务的管控等组件的部署的节点,举例来说,Hadoop YARN 的 ResourceManager 就部署在主实例节点上。用户可以通过 SSH的方式连接到主实例上,通过软件的 Web UI来查看集群上的服务的运行情况。同时当需要进行快速的测试或者运行作业的时候,也可以登录到主实例上,通过命令行来直接提交作业。当集群开启了高可用的时候会有2个主实例节点,默认只有1个。

[font='iconfont'] Core 核心实例


核心实例是被主实例管理的实例节点。上面会运行 Hadoop HDFS 的 Datanode 服务,并保存所有的数据。同时也会部署计算服务,比如Hadoop YARN 的 NodeManager服务,来执行计算任务。为满足存储数据量或者是计算量上升的需要,核心实例可以随时的扩容,不影响当前集群的正常运行。核心使用可以使用多种不同的存储介质来保存数据。参考磁盘介绍。

[font='iconfont'] Task 计算实例


计算实例是专门负责计算的实例节点,是一个可选的实例类型。如果核心实例的计算能力足够的情况下,可以不使用计算实例。计算实例可以在任何时候快速的为集群增加额外的计算能力,如Hadoop 的 MapReduce tasks, Spark executors 等。在计算实例上不会保存 HDFS 的数据,因此在计算实例上不运行Hadoop HDFS 的 Datanode服务。计算实例可以随时的新增和减少,都不会影响到现有集群的运行。计算实例节点的减少可能会引起 MapReduce 和Spark 的作业的失败,能否成功取决于该计算服务的重试容错能力。

展开
收起
nicenelly 2017-10-30 13:40:46 1448 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
大数据解决方案构建详解 以阿里云E-MapReduce为例 立即下载
《E-MapReduce on ACK 全新发布,助力企业高效构建大数据平台》 立即下载
阿里云E-MapReduce 立即下载