开发者社区> 问答> 正文

mapreduce中partition过程是什么?

mapreduce中partition过程是什么?

展开
收起
芯在这 2021-12-10 23:50:11 312 0
1 条回答
写回答
取消 提交回答
  • partition过程:在经过mapper的运行后,输出结果是一个key/value对,MapReduce提供Partitioner接口,它根据key决定当前的这对输出数据最终应该交由哪个reduce task处理。默认是对key hash后再对reduce task数量取模。之后key/value对以及Partition的结果将会被序列化写入map中环形内存缓冲区中,缓冲区的作用是批量收集map结果,减少磁盘IO的影响。

    2021-12-10 23:50:27
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Spark介绍及Spark多数据源分析 立即下载
SparkSQL实践与优化 立即下载
# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门 】 立即下载