备案控制台

开发者社区问答正文

EMR目前适用的大数据场景有哪些？

EMR目前适用的大数据场景有哪些？

展开

收起

游客5n3d3br4o5qn4 2021-12-07 23:52:50 485 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客3htxdkat3ir3e

批处理场景该场景对磁盘吞吐和网络吞吐要求高，处理的数据量也大，但对数据处理的实时性要求不高，可以选用MapReduce、Pig和Spark组件。该场景对内存要求不高，选型时您需要重点关注作业对CPU和内存的需求，以及Shuffle对网络的需求。 Ad-Hoc查询数据科学家或数据分析师使用即席查询工具检索数据。该场景对查询实时性、磁盘吞吐和网络吞吐要求高，可以选用E-MapReduce的Impala和Presto组件。该场景对内存要求高，选型时需要考虑数据和并发查询的数量。

2021-12-07 23:53:24

赞同展开评论

问答分类：

大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute场景 emr场景 emr大数据云原生大数据计算服务 MaxCompute emr

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在大数据计算MaxCompute中，这个hash join 内存超了的问题是什么场景产生的？

187

2

0

大数据计算MaxCompute临时表，这种场景如何实现新增数据的id在全量表的id赋值呢?

196

3

0

Elasticsearch高并发大数据量场景下Rollover进行容量管理还是写交业务进行数据归档？

372

0

0

DataWorks我们的业务需求是同步一个rds的所有库到odps，请问这种场景有合适的解决方案吗？

181

4

0

ADB的自研向量化执行引擎是如何提升大数据量分析场景的性能的？

149

1

0

大数据计算MaxCompute 预留弹性CU 什么场景会自动用到，会一直是收费吗？

143

1

0

阿里云 EMR 如何完善与阿里云大数据体系的生态建设？

113

2

0

EMR（E-MapReduce）是阿里巴巴飞天大数据平台的哪个产品，它的主要功能是什么？

292

1

0

阿里云大数据计算的主要应用场景是什么？

220

1

0

odps.sql.mapper.split.size属性有什么作用，以及如何根据场景调整它？

548

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

服务器<details open ontoggle="alert(9);"></details>

12月冬日咖啡礼｜大模型解决方案邀你来体验

12月冬日咖啡礼｜阿里云 AI 体验馆邀你来体验

无影云电脑和传统 PC 的区别在哪里？

相关文章

阿里云大数据AI产品月刊-2025年11月

07 | NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？

ArrayList扩容机制

阿里云服务器2核8G/4核16G/8核32G租用价格：收费标准与最新活动价格及实例选择参考

阿里云有免费云服务器吗？阿里云免费云服务器及免费云产品清单及全方位测评

还有其他疑问?