开发者社区 问答 正文

mapreduce中split过程是什么?

mapreduce中split过程是什么?

展开
收起
芯在这 2021-12-10 23:49:34 530 分享 版权
1 条回答
写回答
取消 提交回答
  • split过程:在map task执行时,它的输入数据来源于HDFS的block。在MapReduce中,map task只读取split。Split与block的对应关系可能是多对一,默认是一对一。输入分片存储的并不是数据本身,而是一个分片长度和一个记录数据的位置的数组。inputFormat一行一行的读取文件,按行分割形成<key,value>对。其中key为偏移量,value为每行数据内容。

    2021-12-10 23:49:47
    赞同 展开评论
问答分类:
问答标签:
问答地址: