开发者社区 问答 正文

Mapreduce的map阶段优化是怎么实现的?

Mapreduce的map阶段优化是怎么实现的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:41:28 317 分享 版权
1 条回答
写回答
取消 提交回答
  • Mapreduce的map阶段优化:

    (1) 减少spill次数: 通过调整io.sort.mb及sort.spill.percent参数值,增大触发 spill的内存上限,减少spill次数,从而减少磁盘I0。

    (2)减少merge次数:通过调整io.sort.factor参数,增大merge的文件数目,减少merge的次数,从而缩短mr处理时间。

    (3)在map之后先进行combine处理,减少|/O

    2021-12-05 14:43:38
    赞同 展开评论