开发者社区> 问答> 正文

平衡HDFS集群的作用是什么啊?

平衡HDFS集群的作用是什么啊?

展开
收起
游客mm5dulkpivqdo 2021-12-13 00:16:34 527 0
1 条回答
写回答
取消 提交回答
  • 在distcp工具中,如果我们指定map数量为1,不仅速度很慢,每个Block第一个副本将全部落到运行这个唯一map的节点上,直到磁盘溢出。因此使用distcp的时候,最好使用默认的map数量,即20. HDFS在Block均匀分布在各个节点上的时候工作得最好,如果没有办法在作业中尽量保持集群平衡,例如为了限制map数量(以便其他节点可以被别的作业使用),那么可以使用balancer工具来调整集群的Block分布。

    2021-12-13 00:17:02
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
海量数据分布式存储——Apache HDFS之最新进展 立即下载
Hadoop存储与计算分离实践 立即下载
HBase 吞吐量提升实践 立即下载