开发者社区> 问答> 正文

Mapreduce的map阶段优化是怎么实现的?

Mapreduce的map阶段优化是怎么实现的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:41:28 310 0
1 条回答
写回答
取消 提交回答
  • Mapreduce的map阶段优化:

    (1) 减少spill次数: 通过调整io.sort.mb及sort.spill.percent参数值,增大触发 spill的内存上限,减少spill次数,从而减少磁盘I0。

    (2)减少merge次数:通过调整io.sort.factor参数,增大merge的文件数目,减少merge的次数,从而缩短mr处理时间。

    (3)在map之后先进行combine处理,减少|/O

    2021-12-05 14:43:38
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
Spark优化实践 立即下载
GC优化利器 - HBase2.0全链路offheap 立即下载