开发者社区> 问答> 正文

mapreduce 客户端对 map 阶段并行度规划的基本逻辑是怎样的呢?

mapreduce 客户端对 map 阶段并行度规划的基本逻辑是怎样的呢?

展开
收起
游客ydhxr2xydmgpo 2021-12-12 21:37:24 827 0
1 条回答
写回答
取消 提交回答
  • 将待处理数据执行逻辑切片(即按照一个特定切片大小,将待处理数据划分成逻辑上的多 个 split),然后每一个 split 分配一个 mapTask 并行实例处理 这段逻辑及形成的切片规划描述文件,是由 FileInputFormat实现类的 getSplits()方法完成的。 该方法返回的是 List , InputSplit 封装了每一个逻辑切片的信息,包括长度和位置 信息,而 getSplits()方法返回一组 InputSplit

    2021-12-12 21:39:03
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
Flink中的两类新型状态存储 立即下载
HareQL:快速HBase查询工具的发展过程 立即下载