文档备案控制台

开发者社区问答正文

reduce后输出的数据量有多大？

reduce后输出的数据量有多大？

展开

收起

茶什i 2019-10-29 14:20:42 1421 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

珍宝珠

并不是想知道确切的数据量有多大这个，而是想问你，MR的执行机制，开发完程序，有没有认真评估程序运行效率
1）用于处理redcue任务的资源情况，如果是MRV1的话，分了多少资源给map，多少个reduce 如果是MRV2的话，可以提一下，集群有分了多少内存、CPU给yarn做计算。
2）结合实际应用场景回答，输入数据有多大，大约多少条记录，做了哪些逻辑操作，输出的时候有多少条记录，执行了多久，reduce执行时候的数据有没有倾斜等
3）再提一下，针对mapReduce做了哪几点优化，速度提升了多久，列举1,2个优化点就可以

2019-10-30 15:22:51

赞同展开评论

问答地址：

开发者社区 > 云计算 > 问答

相关问答

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

287282

11

0

购买阿里国外的云服务器是否可以访问谷歌？

93728

50

0

this xml file does not appear to have any style in

62045

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142949

16

0

基础语言百问-Python

70218

30

0

搭建dnf私服需要大概啥配置的

10824

2

0

#支付宝授权提示请在支付宝客户端打开链接

25660

19

0

阿里云怎样设置二级域名以及域名解析？

67073

14

0

全息（Holography）技术是什么技术？

1367

1

0

C语言中default使用注意事项是什么？

1764

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

多模态数据信息提取

分析 Agent 实现一键 AI 数据洞察

数据守护：防勒索攻击数据保障

还有其他疑问?