开发者社区> 问答> 正文

MapReduce在Map阶段该如何优化方法呢?

MapReduce在Map阶段该如何优化方法呢?

展开
收起
游客ydhxr2xydmgpo 2021-12-12 20:53:06 844 0
1 条回答
写回答
取消 提交回答
  • 1.减少Spill次数:通过调整io.sort.mb及sort.spill.percent参数值,增大触发Spill的内存上限,减少Spill次数,从而减少磁盘IO.

    2.减少合并次数:通过调整io.sort.factor参数,增大Merge的文件数目,减少Merge的次数,从而缩短MR处理时间。

    3.在Map之后,不影响业务逻辑前提下,先进行Combine处理,减少I/O。

    2021-12-12 20:57:56
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
Spark优化实践 立即下载
HareQL:快速HBase查询工具的发展过程 立即下载