文档备案控制台

开发者社区问答正文

RDS什么场景用presto呢?如果presto很高效，hive，spark对比优劣

RDS什么场景用presto呢，如果presto很高效，hive，spark对比优劣，以及使用场景是什么呢？

展开

收起

鸡蛋灌饼儿 2023-01-15 18:29:06 742 版权

来自：阿里云支持与服务

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

aliyun6918228952

"个的使用场景还是在交互式即席查询这一部分，可以让我们的分析变的非常丝滑主要区别的话第一个就是，Presto使用ANSI SQL，而Hive使用HiveQL，刚才我们简单的语句其实并没有影响，但整体上有些差异的，比如我们hive的侧窗口函数 LATERAL VIEW 第二个比较重要的就是，数据量相对大或者存在我们意料之外的数据膨胀这种场景的话，更推荐hive和spark来做每日跑批的计算。这个可以结合我们昨天的一个答疑来看，就是什么时候会落盘，spark和hive在数据量大，oom的时候会进行落盘保证任务的完成。但是presto直接抛oom异常了 impala这一块其实和presto一样都是属于olap的引擎，impala的计算速度也是出了名的快，多表查询性能和presto可以说不相上下，但是内存占用确实不小，单表查询有些逊色，使用上来说有个缺点，就是不支持date类型，需要存成string，presto支持的update等操作也不支持，综合性能上来说presto更优一些——该回答整理自钉群“企业运维训练营之大数据EMR原理与实践”

2023-01-15 19:46:01

赞同展开评论

问答分类：

SQL 分布式计算关系型数据库 HIVE Spark RDS 云数据库 RDS MySQL 版

问答标签：

云数据库 RDS MySQL 版场景云数据库 RDS MySQL 版hive Hive spark hive apache spark apache spark Hive

问答地址：

开发者社区 > 阿里云支持与服务 > 问答

相关问答

E-MapReduce开启使用DLF统一元数据后本地开发spark程序想访问emr hive中...

172

0

0

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

465

1

0

大数据计算MaxCompute 执行 Hive Sql 时，用的什么引擎啊，是Spark 吗？

222

1

0

通过spark-sql往hive的一个表随便插入一条数据，然后在hive中查询这个表报错

385

0

0

在传统数仓基于Hive表的实现中，处理SCD场景存在哪些主要问题？

225

2

0

在进行RDS库表恢复到原实例的过程中，如果原实例配有只读实例，这个场景怎么处理只读实例？

192

0

0

在进行RDS库表恢复到原实例的过程中，如果原实例配有只读实例，这个场景怎么处理只读实例？

147

0

0

RDS（关系型数据库服务）的应用场景是什么？

257

1

0

想问下有没有大佬尝试过Flink SQL，在kinit场景下批写hive表的呢？

162

1

0

Flink CDC同步到hudi 可以直接读取hudi 的数据吗例如用hive 或者spark？

263

2

0

收录在圈子:

阿里云支持与服务

2306

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

阿里云服务器问题解答，你关心的问题都在这！

阿里云 ECS 公网 IP有什么更换技巧？

idea 插件，更新记忆规则，经常死机

总是提示您已达到配额使用上限，请升级订阅计划，以获得更多使用资源。问题反馈。但已经购买了资源

相关文章

2026年阿里云新用户优惠权益：优惠券、云服务器38元起、域名1元注册等活动介绍

EMR Serverless Daft 如何简化多模态数据处理：视频抽帧、清洗、标注全流程与具身智能实践

行为数据链路设计：从问题定位到策略回流

AI回答采集系统上云实战：从本地原型到生产部署

03｜Nacos 生产落地：多环境、踩坑、和 3.0 的 AI Registry 演进

相关解决方案

更多

RDS 与 ClickHouse 构建一站式 HTAP

Tair 实现即时通信场景中的消息多端同步

快捷搭建企业经营数据大屏

RDS 到 Redis 实时同步方案

基于 Spark 和 PyTorch 的模型训练方案

还有其他疑问?