开发者社区 问答 正文

Mapreduce跑的慢的原因是什么?

Mapreduce跑的慢的原因是什么?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:36:10 610 分享 版权
1 条回答
写回答
取消 提交回答
  • Mapreduce跑的慢的原因:

    1.计算机性能 CPU、内存、磁盘健康、网络(所以万一MR跑得慢了,最简单的方式是提 高计算及性能,加内存等等! )

    1. I/O操作优化 (1) 数据倾斜 (2) map和reduce数设 置不合理(切片 问题) (3) reduce等待过久 (4)小文件过多: (5)大量的不可分块的超大文件 (6) spill次数过多 (磁盘溢写次数过多) (7) merge次数过多等(因为要对数据进行归并排序)
    2021-12-05 14:37:50
    赞同 展开评论
问答分类:
问答地址: