开发者社区> 问答> 正文

mapreduce中split过程是什么?

mapreduce中split过程是什么?

展开
收起
芯在这 2021-12-10 23:49:34 452 0
1 条回答
写回答
取消 提交回答
  • split过程:在map task执行时,它的输入数据来源于HDFS的block。在MapReduce中,map task只读取split。Split与block的对应关系可能是多对一,默认是一对一。输入分片存储的并不是数据本身,而是一个分片长度和一个记录数据的位置的数组。inputFormat一行一行的读取文件,按行分割形成<key,value>对。其中key为偏移量,value为每行数据内容。

    2021-12-10 23:49:47
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
LEARNINGS USING SPARK STREAMING & DATAFRAMES FOR WALMART SEARCH 立即下载
# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门 】 立即下载
《Apache Flink-重新定义计算》PDF下载 立即下载