开发者社区> 问答> 正文

Hiva中MR运行的过程是怎样的?

Hiva中MR运行的过程是怎样的?

展开
收起
游客5n3d3br4o5qn4 2021-12-06 23:39:37 374 0
1 条回答
写回答
取消 提交回答
  • MR运行的完整过程:

    Map在读取数据时,先将数据拆分成若干数据,并读取到Map方法中被处理。数据在输出的时候,被分成若干分区并写入内存缓存(buffer)中,内存缓存被数据填充到一定程度会溢出到磁盘并排序,当Map执行完后会将一个机器上输出的临时文件进行归并存入到HDFS中。

    当Reduce启动时,会启动一个线程去读取Map输出的数据,并写入到启动Reduce机器的内存中,在数据溢出到磁盘时会对数据进行再次排序。当读取数据完成后会将临时文件进行合并,作为Reduce函数的数据源。

    2021-12-06 23:40:04
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
《Pulsar 2.8.0 功能特性概述及规划》 立即下载
Spark优化实践 立即下载
Apache Flink 流式应用中状态的数据结构定义升级 立即下载