开发者社区 问答 正文

Mapreduce的数据输入优化方法是怎么实现的?

Mapreduce的数据输入优化方法是怎么实现的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:39:18 335 分享 版权
1 条回答
写回答
取消 提交回答
  • Mapreduce的数据输入优化方法:

    (1) 合并小文件:在执行mr任务前将小文件进行合并,大量的小文件会产生大量的map任务,增大map任务装载次数,而任务的装载比较耗时,从而导致mr运行较慢。

    (2)采用ConbinFileInputFormat来作为输入,解决输入端大量小文件场景。

    2021-12-05 14:40:15
    赞同 展开评论