CDH5.6下线Hdfs的DataNode

简介: CDH5.6下线Hdfs的DataNode

CDH5.6下线Hdfs的DataNode

1、准备工作

1.1 健康检查

# 退役/下线过程中也需要检查
hdfs fsck / -list-corruptfileblocks -openforwrite -files -blocks -locations

1.2 问题处理

# 若hdfs出现块问题可进入如下操作处理
hdfs fsck file_name -move
# 或
hdfs fsck file_name -delete

1.3 带宽调整

# balance带宽,平衡带宽值应小于磁盘和网络上的带宽,
# 以最大限度地减少对群集的影响,但需花费更长时间,如下值仅供参考
dfs.datanode.balance.bandwidthPerSec = 500MB/S

2、确定节点

进入Hdfs的实例列表,选择需要下线的DataNode节点。

3、维护模式

CDH中Hdfs的DataNode进入维护模式的作用是为了在不影响集群可用性的情况下,对DataNode进行短期的操作,比如系统升级或重启。

维护模式与退役模式不同,退役模式适用于长期的操作,比如替换硬件或移除节点。

当管理员将DataNode置于维护模式时,DataNode会先进入ENTERING_MAINTENANCE状态,然后在所有属于该DataNode的块都在其他地方有最小副本数的情况下,DataNode会进入IN_MAINTENANCE状态。

4、退役节点

4.1 解除授权

CDH中Hdfs对DataNode解除授权的作用是为了在不需要该DataNode的情况下,将其从集群中移除,比如替换硬件或减少节点数。

解除授权的过程会将DataNode上的所有块复制到其他DataNode上,以保证数据的可靠性;且DataNode会在DataNode的UI上显示为退役状态。解除授权的DataNode可以通过重新授权的方式重新加入集群。

解除授权过程中千万不要中止, 否则很大概率会出现数据块丢失的问题!

4.2 完成解除

解除授权后就相当于已经把这个DataNode节点退役完成。

5、删除节点

删除下线的DataNode,至此就完成了Hdfs的DataNode下线。

6、注意事项

  1. CDH5.6比较特殊, 通过配置dfs_host的方式无法生效;
  2. 通过解除授权即可下线, 但是解除过程中切记不要中止, 否则大概率会发生数据块丢失的问题。
相关文章
|
5月前
|
存储 分布式计算 Hadoop
NameNode和DataNode在HDFS中的作用是什么?
NameNode和DataNode在HDFS中的作用是什么?
308 0
|
5月前
|
存储 分布式计算 Hadoop
HDFS中的NameNode和DataNode的作用是什么?它们之间的通信方式是什么?
HDFS中的NameNode和DataNode的作用是什么?它们之间的通信方式是什么?
430 0
ambari安装部署HDFS--添加DataNode节点和nfsgateways(二)
ambari安装部署HDFS--添加DataNode节点和nfsgateways(二)
431 0
ambari安装部署HDFS--添加DataNode节点和nfsgateways(二)
|
存储 大数据
大数据数据存储的分布式文件系统的HDFS的基本概念和架构的基本架构的DataNode
在 Hdfs 中,DataNode 是一个非常重要的组件,它负责存储数据块(Block)中的数据。
69 1
|
机器学习/深度学习 缓存 分布式计算
Hadoop基础学习---4、HDFS写、读数据流程、NameNode和SecondaryNameNode、DataNode
Hadoop基础学习---4、HDFS写、读数据流程、NameNode和SecondaryNameNode、DataNode
|
存储
Hadoop-HDFS的DataNode工作机制
Hadoop-HDFS的DataNode工作机制
150 0
Hadoop-HDFS的DataNode工作机制
HDFS源码分析心跳汇报之DataNode注册
        HDFS源码分析心跳汇报之DataNode注册,近期推出!
904 0
|
2月前
|
存储 分布式计算 Hadoop
【揭秘Hadoop背后的秘密!】HDFS读写流程大曝光:从理论到实践,带你深入了解Hadoop分布式文件系统!
【8月更文挑战第24天】Hadoop分布式文件系统(HDFS)是Hadoop生态系统的关键组件,专为大规模数据集提供高效率存储及访问。本文深入解析HDFS数据读写流程并附带示例代码。HDFS采用NameNode和DataNode架构,前者负责元数据管理,后者承担数据块存储任务。文章通过Java示例演示了如何利用Hadoop API实现数据的写入与读取,有助于理解HDFS的工作原理及其在大数据处理中的应用价值。
58 1
下一篇
无影云桌面