开发者社区 问答 正文

MapReduce中CombineTextInputFormat中的虚拟存储过程是什么?

MapReduce中CombineTextInputFormat中的虚拟存储过程是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-04 20:04:35 234 分享 版权
1 条回答
写回答
取消 提交回答
  • 将输入目录下所有文件大小,依次和设置的setMaxInputSplitSize值比较,如果不大于设置的最大值,逻辑上划分一个块。如果输入文件大于设置的最大值且大于两倍,那么以最大值切割一块;当剩余数据大小超过设置的最大值且不大于最大值2倍,此时将文件均分成2个虚拟存储块(防止出现太小切片)。

    2021-12-04 20:04:50
    赞同 展开评论
问答分类:
问答地址: