开发者社区 问答 正文

MapReduce中的CombineTextInputFormat切片机制是什么?

MapReduce中的CombineTextInputFormat切片机制是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-04 20:01:33 315 分享 版权
1 条回答
写回答
取消 提交回答
  • 框架默认的TextInputFormat切片机制是对任务按文件规划切片,不管文件多小,都会是一个单独的切片,都会交给一个MapTask,这样如果有大量小文件,就会产生大量的MapTask,而创建MapTask的开销比较大,处理效率极其低下。

    2021-12-04 20:01:47
    赞同 展开评论