开发者社区 问答 正文

使用HttpFs代理作为distcp源或者目标需要注意什么?

使用HttpFs代理作为distcp源或者目标需要注意什么?

展开
收起
游客fbdr25iajcjto 2021-12-04 22:42:37 493 分享 版权
1 条回答
写回答
取消 提交回答
  • 注意:如果想保持HDFS的负载均衡,最好不要让distcp用-m指定1,这样他的任务由一个map执行,对该map所在的datanode影响较大,多个map可以缓解这种负载不均衡的现象,但也无法避免,最好使用默认的20个map即可。当然可以运用工具来控制集群中的块分布的均匀程度来进一步缓解这种负载不均衡的现象。

    2021-12-04 22:43:11
    赞同 展开评论
问答地址: