开发者社区> 问答> 正文

Hadoop优化Reduce 阶段是什么?

Hadoop优化Reduce 阶段是什么?

展开
收起
xin在这 2021-12-05 17:52:25 362 0
1 条回答
写回答
取消 提交回答
  • (1)合理设置 Map 和 Reduce 数:两个都不能设置太少,也不能设置太多。太少,会 导致 Task 等待,延长处理时间;太多,会导致 Map、Reduce 任务间竞争资源,造成处理超时等错误。

    (2)设置 Map、Reduce 共存:调整 slowstart.completedmaps 参数,使 Map 运行到一定程度后,Reduce 也开始运行,减少 Reduce 的等待时间。

    (3)规避使用 Reduce,因为 Reduce 在用于连接数据集的时候将会产生大量的网络消 耗。

    (4)增加每个 Reduce 去 Map 中拿数据的并行数

    (5)集群性能可以的前提下,增大 Reduce 端存储数据内存的大小。

    2021-12-05 17:52:52
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载

相关实验场景

更多