开发者社区 问答 正文

job 红线切片的作用是什么呢?

job 红线切片的作用是什么呢?

展开
收起
游客mm5dulkpivqdo 2021-12-12 23:01:56 451 分享 版权
1 条回答
写回答
取消 提交回答
  • 红线切片,将数据按照100M进行切片,每个MapTask处理同样大小的100M数据,看似很公平,datanode1的MapTask处理100M数据,剩下的28m传输给datanode2的MapTask,datanode2的MapTask处理28m+本地的72m数据,剩下的56m再传输给datanode3的MapTask.这样就增加了84m的网络传输数据.为了减少网络传输,yarn有一个本地原则,即block保存在哪个节点上,就在哪个节点上启动MapTask

    2021-12-12 23:03:45
    赞同 展开评论
问答地址: