开发者社区> 问答> 正文

hadoop中Reduce阶段的操作方法有哪些?

hadoop中Reduce阶段的操作方法有哪些?

展开
收起
游客qzzytmszf3zhq 2021-12-08 21:56:44 339 0
1 条回答
写回答
取消 提交回答
  • 合理设置Map和Reduce数:两个都不能设置太少,也不能设置太多。太少,会导致Task等待,延长处理时间;太多,会导致 Map、Reduce任务间竞争资源,造成处理超时等错误。

    设置Map、Reduce共存:调整 slowstart.completedmaps 参数,使Map运行到一定程度后,Reduce也开始运行,减少Reduce的等待时间

    规避使用Reduce,因为Reduce在用于连接数据集的时候将会产生大量的网络消耗。

    增加每个Reduce去Map中拿数据的并行数

    集群性能可以的前提下,增大Reduce端存储数据内存的大小

    2021-12-08 21:56:57
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载