文档备案控制台

开发者社区问答正文

介绍一下Apache Hive & Tez工具？

介绍一下Apache Hive & Tez工具？

展开

收起

张柠檬 2022-05-12 11:42:37 565 版权

来自：阿里技术

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客gwxzsspn6neze

Hive应该是最有名气的数据仓库工具了吧，他将HDFS上的数据组织成关系型数据库的形式，并提供了HiveSQL进行结构化查询，使得数据分析人员可以从传统的关系型数据库几乎无缝的过渡到HDFS上，但其个别函数和传统SQL还是有区别的，并且默认也不支持update和delete操作。但开发人员可以开发UDF，为HiveSQL扩充属于自己的功能函数。Hive本身的计算是基于MapReduce的，后来为了应对SparkSQL的出现，开发组推出了Hive on Spark，使得SQL的解释、分析、优化还是在Hive上，而执行阶段交由Spark去完成，从而以达到和SparkSQL近似的速度。

Tez是对Hive的另一项优化，为其引入了DAG的概念，增加任务并行度从而提升Hive的查询速度，但其本质仍旧是MapReduce，所以提升效果相比Hive on Spark来讲并不足够明显。

2022-05-12 12:26:22

赞同展开评论

问答分类：

SQL Apache HIVE

问答标签：

Hive工具 Apache hive Apache工具 Apache tez Apache hive tez

问答地址：

开发者社区 > 阿里技术 > 问答

相关问答

Apache_OpenOffice_这个工具大家用的多吗？目前好用吗？

396

1

0

大数据计算MaxCompute把云上mc的数据拿下来，放到cdh hive里面，这块有推荐的工具吗？

262

2

0

Apache Dubbo这里说的扫描工具是啥?

238

1

0

Apache Flink China读hive报这个，该怎么解决？

496

2

0

大家有做过oracle 同步数据到 hive 吗? 用什么工具比较好?

496

1

0

Apache Hive & Tez是什么？

562

1

0

大佬们，有没有搞apache hive的，我想问一下metastore的日志自动回滚搞啊，我用命令：

900

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

2039

6

0

flink1.16不支持hive2.1了吗？

1003

1

0

flink CDC可以直接将mysql中的数据直接写入到hive中吗？

905

1

0

收录在圈子:

阿里技术

7057

+ 订阅

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

【Qoder CN】模型提供商：支持自定义第三方的URL

Pro试用版是只有300的Credits么？

相关文章

分组累计求和--极简法

智能问数从 Demo 到生产：语义层、Schema Grounding 与 SQL 审核闭环

阿里云 EMR Serverless StarRocks（Stella 2.2.0）发布：多模态处理与分析闭环，内表与湖表统一检索

AI 数据库助手的权限边界：从最小权限到可追溯执行的七层控制

AI 数据库助手的权限边界：从最小权限到可追溯执行的七层控制

还有其他疑问?