CDH5.6下线Hdfs的DataNode

简介: CDH5.6下线Hdfs的DataNode

CDH5.6下线Hdfs的DataNode

1、准备工作

1.1 健康检查

# 退役/下线过程中也需要检查
hdfs fsck / -list-corruptfileblocks -openforwrite -files -blocks -locations

1.2 问题处理

# 若hdfs出现块问题可进入如下操作处理
hdfs fsck file_name -move
# 或
hdfs fsck file_name -delete

1.3 带宽调整

# balance带宽,平衡带宽值应小于磁盘和网络上的带宽,
# 以最大限度地减少对群集的影响,但需花费更长时间,如下值仅供参考
dfs.datanode.balance.bandwidthPerSec = 500MB/S

2、确定节点

进入Hdfs的实例列表,选择需要下线的DataNode节点。

3、维护模式

CDH中Hdfs的DataNode进入维护模式的作用是为了在不影响集群可用性的情况下,对DataNode进行短期的操作,比如系统升级或重启。

维护模式与退役模式不同,退役模式适用于长期的操作,比如替换硬件或移除节点。

当管理员将DataNode置于维护模式时,DataNode会先进入ENTERING_MAINTENANCE状态,然后在所有属于该DataNode的块都在其他地方有最小副本数的情况下,DataNode会进入IN_MAINTENANCE状态。

4、退役节点

4.1 解除授权

CDH中Hdfs对DataNode解除授权的作用是为了在不需要该DataNode的情况下,将其从集群中移除,比如替换硬件或减少节点数。

解除授权的过程会将DataNode上的所有块复制到其他DataNode上,以保证数据的可靠性;且DataNode会在DataNode的UI上显示为退役状态。解除授权的DataNode可以通过重新授权的方式重新加入集群。

解除授权过程中千万不要中止, 否则很大概率会出现数据块丢失的问题!

4.2 完成解除

解除授权后就相当于已经把这个DataNode节点退役完成。

5、删除节点

删除下线的DataNode,至此就完成了Hdfs的DataNode下线。

6、注意事项

  1. 1.CDH5.6比较特殊, 通过配置dfs_host的方式无法生效;
  2. 2.通过解除授权即可下线, 但是解除过程中切记不要中止, 否则大概率会发生数据块丢失的问题。
相关文章
|
Web App开发 SQL 资源调度
CDH/CDP中开启kerberos后如何访问HDFS/YARN/HIVESERVER2 等服务的webui
CDH/CDP中开启kerberos后如何访问HDFS/YARN/HIVESERVER2 等服务的webui
CDH5.6下线Hdfs的DataNode
CDH5.6下线Hdfs的DataNode
472 0
|
消息中间件 关系型数据库 Kafka
Flink CDC可以从Kafka消费数据并写入到Doris中
Flink CDC可以从Kafka消费数据并写入到Doris中
1053 2
|
分布式计算 资源调度 Hadoop
|
分布式数据库 Hbase
HBase StochasticLoadBalancer组件介绍
HBase StochasticLoadBalancer组件介绍。
3208 0
|
分布式数据库 Hbase 存储
带你读《HBase原理与实践》之一:HBase概述
Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建大规模结构化存储集群,提供海量数据高性能的随机读写能力。
|
缓存 监控 Java
"Java垃圾回收太耗时?阿里HBase GC优化秘籍大公开,让你的应用性能飙升90%!"
【8月更文挑战第17天】阿里巴巴在HBase实践中成功将Java垃圾回收(GC)时间降低90%。通过选用G1垃圾回收器、精细调整JVM参数(如设置堆大小、目标停顿时间等)、优化代码减少内存分配(如使用对象池和缓存),并利用监控工具分析GC行为,有效缓解了高并发大数据场景下的性能瓶颈,极大提升了系统运行效率。
478 4
|
存储 分布式计算 Hadoop
Hadoop中DataNode故障
【7月更文挑战第11天】
720 1
|
缓存 Java 大数据
CDH大数据环境参数优化指南
CDH大数据环境参数优化指南
|
存储 分布式计算 Hadoop

热门文章

最新文章