开发者社区> garygao305> 正文

EMR学习笔记(1)HDFS

简介: 对比开源HDFS,介绍说明EMR集群的HDFS组件基本架构部署情况。并演示远程登录主、从节点,进行基本运维,服务启停等操作。
+关注继续查看

EMR HDFS Architecture

本文以非HA集群,2个worker的集群为例。
_2019_06_07_11_13_38
emr_hdfs

非HA集群,仅有一个Namenode实例,部署在Master节点。
Namenode主要职责:
-管理文件系统namespace,包括但不仅限于:开、关文件,文件改名,目录操作等。
-管控客户端对文件的访问

EMR hadoop集群,每个Worker节点仅部署一个Datanode实例。
Datanode主要职责:
-管理所在节点挂载的存储
-提供给客户端读写服务
-block创建、删除以及replication

登录EMR集群实现基本运维

在较新的集群版本中(3.2 以上版本),所有的服务操作都可以通过集群的配置管理功能来完成。推荐优先使用 Web 页面的管理方式。

若您觉得在网页上的作业和执行计划无法满足您更加复杂的应用需求,您可以登录到 E-MapReduce 集群的主机上。找到集群的详情页,其中就有集群 master 机器的公网 IP 地址,您可以直接 SSH 登录到这台机器上,查看各种设置与状态。

登录 Master 主机步骤

  1. 使用如下命令 SSH 登录到 master 主机。请在集群详情页的主机信息栏中获取集群 master 机器的公网 IP。
    ssh root@ip.of.master
  2. 输入创建集群时设定的密码。

如何登录 Core 节点
A:按照如下步骤:

  1. 首先在 Master 节点上切换到 Hadoop 账号:
    su hadoop
  2. 然后即可免密码 SSH 登录到对应的 Core 节点:
    ssh emr-worker-1
  3. 通过 sudo 可以获得 root 权限:
    sudo vi /etc/hosts

通过命令行方式启停服务进程
操作用账号:hdfs

  • NameNode (Master 节点)
// 启动
/usr/lib/hadoop-current/sbin/hadoop-daemon.sh start namenode
// 停止
/usr/lib/hadoop-current/sbin/hadoop-daemon.sh stop namenode
  • DataNode (Core 节点)
// 启动
/usr/lib/hadoop-current/sbin/hadoop-daemon.sh start datanode
// 停止
/usr/lib/hadoop-current/sbin/hadoop-daemon.sh stop datanode

示例:登录实际emr集群演示停止datanode进程操作
20190608093637

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
HDFS(二)|学习笔记
快速学习 HDFS(二)
64 0
爬虫识别-HDFS数据恢复到 Redis| 学习笔记
快速学习爬虫识别-HDFS数据恢复到 Redis
48 0
网站流量日志 Flume收集--hdfs--基于文件闲置策略滚动| 学习笔记
快速学习网站流量日志 Flume收集--hdfs--基于文件闲置策略滚动
49 0
HDFS(一)|学习笔记
快速学习 HDFS(一)
46 0
CDH 搭建_ Hadoop _ HDFS _主节点|学习笔记
快速学习 CDH 搭建_ Hadoop _ HDFS _主节点
113 0
CDH 搭建_ Hadoop _ HDFS _从节点和总结|学习笔记
快速学习 CDH 搭建_ Hadoop _ HDFS _从节点和总结
39 0
配置 HDFS-创建 Kerberos 对应的账户设置 Keytab 文件|学习笔记
快速学习配置 HDFS-创建 Kerberos 对应的账户设置 Keytab 文件
670 0
使用EMR-Flume将非EMR集群的数据同步至EMR集群的HDFS
E-MapReduce从3.20.0版本开始对EMR-Flume新增了Log Service Source。借助Log Service的Logtail等工具,可以将需要同步的数据实时采集并上传到LogHub,再使用EMR-Flume将LogHub的数据同步至EMR集群的HDFS
1338 0
EMR使用OSS还是云盘HDFS存储的选择讨论
使用EMR如何选择数据存储方案,这里分别列举各种场景下两种方案的优缺点,各位可以根据实际情况,选择最合适自己业务的一种方式。
6707 0
Hadoop 之 HDFS 进程详解
你好看官,里面请!今天笔者讲的是Hadoop 之 HDFS 进程详解。不懂或者觉得我写的有问题可以在评论区留言,我看到会及时回复。 注意:本文仅用于学习参考,不可用于商业用途,如需转载请跟我联系。
18 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
海量数据分布式存储——Apache HDFS之最新进展
立即下载
HDFS optimization for Hbase At XiaoMi
立即下载
HDFS optimization for HBase at XiaoMi
立即下载