文档备案控制台

开发者社区问答正文

Spark SQL和Hive On Spark的区别是什么？

Spark SQL和Hive On Spark的区别是什么？

展开

收起

芯在这 2021-12-08 14:04:30 1049 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

其中SparkSQL作为Spark生态的一员继续发展，而不再受限于Hive，只是兼容Hive；而Hive on Spark是一个Hive的发展计划，该计划将Spark作为Hive的底层引擎之一，也就是说，Hive将不再受限于一个引擎，可以采用Map-Reduce、Tez、Spark等引擎。

两者区别：

Spark SQL刚开始也是使用了hive里面一些东西的，但是Spark SQL里面的hive版本肯定要比hive社区理的版本要低一些的，那么hive里面有的东西，比如说原来跑在mapreduce之上已有的一些功能，如果你使用hive on spark的话他是能支持的，但是有一些功能想要直接在Spark SQL上直接用，很可能是没有办法支持，因为Spark SQL里面的一些功能并没有hive完善，毕竟hive已经这么多年，而Spark只是发展了这两三年而已。那么shark终止以后，在Spark界重心就已经在Spark SQL上了，Spark SQl干的事情和原来的shark是有很大的差别的，因为原来的shark依赖了很多hive的东西，那么在sparksql里面就必须要把这个依赖更好的减轻。

2021-12-08 14:04:56

赞同展开评论

问答分类：

SQL 分布式计算 HIVE Spark

问答标签：

apache spark SQL Hive spark SQL spark apache spark Hive spark Hive

问答地址：

开发者社区 > 大数据 > 问答

相关问答

实时计算Flink SQL和传统SQL有什么区别

595

1

0

E-MapReduce开启使用DLF统一元数据后本地开发spark程序想访问emr hive中...

122

0

0

大数据计算MaxCompute 执行 Hive Sql 时，用的什么引擎啊，是Spark 吗？

160

1

0

在SQL中，DATETIME和TIMESTAMP类型有什么区别？为什么优先选择TIMESTAMP？

662

1

0

MaxCompute有没有类似hive hive -e执行sql这种命令

142

1

0

flink cdc source connector 分为普通cdc版本和sql版本有什么区别？

324

2

0

RDS SQL server 的按量付费和serverless有何区别？

295

1

0

我如何将一个oss 挂载到emr集群。以便通过hive sql 查询oss 里的日志数据？

169

0

0

云数据库RDS SQL Server的共享版本与独享版本有什么区别？

153

0

0

OneSQL OLAP分析平台在Hive SQL兼容性方面进行了哪些改进？

157

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

OpenClaw Gateway Token 获取？

阿里云千问Token价格怎么收费？

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

相关文章

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

别把数据中台做成“数据坟场”：聊聊企业数据中台架构的真实落地之路

实战：用飞算JavaAI专业版写一个完整的博客系统

蓝易云：Mybatis的批处理工具：MybatisBatchUtils功能全解

企业如何用IP地址进行风控管理？一套实操方案

还有其他疑问?