开发者社区> 问答> 正文

EMR目前适用的大数据场景有哪些?

EMR目前适用的大数据场景有哪些?

展开
收起
游客5n3d3br4o5qn4 2021-12-07 23:52:50 423 0
1 条回答
写回答
取消 提交回答
  • 批处理场景 该场景对磁盘吞吐和网络吞吐要求高,处理的数据量也大,但对数据处理的实时性要求不高,可以选用MapReduce、Pig和Spark组件。该场景对内存要求不高,选型时您需要重点关注作业对CPU和内存的需求,以及Shuffle对网络的需求。 Ad-Hoc查询 数据科学家或数据分析师使用即席查询工具检索数据。该场景对查询实时性、磁盘吞吐和网络吞吐要求高,可以选用E-MapReduce的Impala和Presto组件。该场景对内存要求高,选型时需要考虑数据和并发查询的数量。

    2021-12-07 23:53:24
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
生命密码-基因数据的EMR实践 立即下载
超大规模机器学习在EMR的实践 立即下载
EMR弹性低成本离线大数据分析最佳实践 立即下载