开发者社区> 问答> 正文

reduce后输出的数据量有多大?

reduce后输出的数据量有多大?

展开
收起
茶什i 2019-10-29 14:20:42 1325 0
1 条回答
写回答
取消 提交回答
  • 并不是想知道确切的数据量有多大这个,而是想问你,MR的执行机制,开发完程序,有没有认真评估程序运行效率
    1)用于处理redcue任务的资源情况,如果是MRV1的话,分了多少资源给map,多少个reduce 如果是MRV2的话,可以提一下,集群有分了多少内存、CPU给yarn做计算 。
    2)结合实际应用场景回答,输入数据有多大,大约多少条记录,做了哪些逻辑操作,输出的时候有多少条记录,执行了多久,reduce执行时候的数据有没有倾斜等
    3)再提一下,针对mapReduce做了哪几点优化,速度提升了多久,列举1,2个优化点就可以

    2019-10-30 15:22:51
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载