开发者社区 问答 正文

map并行度的的概念是什么?

map并行度的的概念是什么?

展开
收起
游客mm5dulkpivqdo 2021-12-06 00:02:01 405 分享 版权
1 条回答
写回答
取消 提交回答
  • 1.如果硬件配置为2*12core + 64G,恰当的map并行度是大约每个节点20-100个map,最好每个map的执行时间至少一分钟。

    2.如果job的每个map或者 reduce task的运行时间都只有30-40秒钟,那么就减少该job的map或者reduce数,每一个task(map|reduce)的setup和加入到调度器中进行调度,这个中间的过程可能都要花费几秒钟,所以如果每个task都非常快就跑完了,就会在task的开始和结束的时候浪费太多的时间。

    2021-12-06 00:03:02
    赞同 展开评论
问答标签:
问答地址: