开发者社区> 问答> 正文

mapreduce的核心程序运行机制是什么?

mapreduce的核心程序运行机制是什么?

展开
收起
游客ydhxr2xydmgpo 2021-12-12 21:35:22 813 0
1 条回答
写回答
取消 提交回答
  • 一个完整的 mapreduce 程序在分布式运行时有两类实例进程: (1) MRAppMaster:负责整个程序的过程调度及状态协调 (该进程在yarn节点上)

    (2) Yarnchild:负责 map 阶段的整个数据处理流程

    (3) Yarnchild:负责 reduce 阶段的整个数据处理流程

    以上两个阶段 maptask 和 reducetask 的进程都是 yarnchild,并不是说这 maptask 和 reducetask 就跑在同一个 yarnchild 进行里 (Yarnchild进程在运行该命令的节点上)

    2021-12-12 21:35:51
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
HBase 基本知识介绍及典型案例分析 立即下载
HBase 基本知识介绍及典型案例分析 立即下载
HBase基本知识介绍及典型案例分析 立即下载