Apache Hive简单概述

简介: Apache Hive简单概述

分布式SQL计算

数据的统计可以使用编程语言和sql

image.png

对数据进行统计分析,SQL目前是最为方便的编程工具

大数据体系中充斥着非常多的统计分析场景

所以使用sql去处理数据,在大数据中也是有极大的需求的

 

MapReduce支持程序开发(JAVApython

但是不支持SQL开发

image.png

为什么使用Hive

使用Hadoop MapReduce直接处理数据所面临的问题

人员学习成本太高,需要掌握javapython等编程语言

MapReduce实现复制查询逻辑开发难度太大

 

使用Hive处理数据的好处

操作接口采用类SQL语法,提供快速开发的能力(简单,易上手)

底层执行MapReduce,可以完成分布式海量数据的SQL处理

目录
相关文章
|
2月前
|
SQL 存储 分布式计算
Apache Kylin 概述
Apache Kylin 概述
|
3月前
|
SQL 数据可视化 Apache
阿里云数据库内核 Apache Doris 兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移
阿里云数据库 SelectDB 内核 Doris 的 SQL 方言转换工具, Doris SQL Convertor 致力于提供高效、稳定的 SQL 迁移解决方案,满足用户多样化的业务需求。兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移。
阿里云数据库内核 Apache Doris 兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移
|
11月前
|
SQL 关系型数据库 MySQL
Hive报错:HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me
Hive报错:HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me
405 0
|
3月前
|
SQL 分布式计算 Java
Apache Hudi与Hive集成手册
Apache Hudi与Hive集成手册
250 0
|
3月前
|
SQL 分布式计算 安全
HIVE启动错误:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeExcept
HIVE启动错误:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeExcept
212 0
|
3月前
|
SQL 分布式计算 MaxCompute
Apache Flink目前不支持直接写入MaxCompute,但是可以通过Hive Catalog将Flink的数据写入Hive表
Apache Flink目前不支持直接写入MaxCompute,但是可以通过Hive Catalog将Flink的数据写入Hive表
82 3
|
3月前
|
SQL 存储 Apache
流数据湖平台Apache Paimon(四)集成 Hive 引擎
流数据湖平台Apache Paimon(四)集成 Hive 引擎
318 0
|
3月前
|
存储 SQL 消息中间件
流数据湖平台Apache Paimon(一)概述
流数据湖平台Apache Paimon(一)概述
280 0
|
11月前
|
SQL 存储 分布式计算
大数据Hive入门概述
大数据Hive入门概述
212 1
|
SQL 资源调度 Java
Apache Doris Broker快速体验之Hive安装部署(2)3
Apache Doris Broker快速体验之Hive安装部署(2)3
137 0

推荐镜像

更多