Hadoop Hive概念学习系列之hive里的HiveQL——查询语言(十五)

简介:

Hive的操作与传统关系型数据库SQL操作十分类似。

 

  Hive主要支持以下几类操作:

DDL

  1、DDL:数据定义语句,包括CREATE、ALTER、SHOW、DESCRIBE、DROP等。

 

     详细点,就是

  Hive支持大量SQL数据定义语言(Data Definition Language,DDL)中的现有功能,包括以下各种语句:

  CREATE DATABASE/SCHEMA,TABLE,VIEW,FUNCTION,INDEX

  DROP DATABASE/SCHEMA,TABLE,VIEW,INDEX

  TRUNCATE TABLE

  ALTER DATABASE/SCHEMA,TABLE,VIEW

  MSCK REPAIR TABLE (or ALTER TABLE RECOVER PARTITIONS)

  SHOW DATABASES/SCHEMAS,TABLES,TBLPROPERTIES,PARTITIONS,FUNCTIONS,INDEX[ES]

  DESCRIBE DATABASE,table_name,view_name

 

  具体,见  

      Hive的数据类型和DDL见   https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL

 

 

 

DML

  2、DML:数据操作语句,包括LOAD DATA,INSERT(将查询结果写入Hive表或文件系统中)。

       注意,Hive的设计中,没有考虑UPDATE操作。

 

 详细点,就是

  Hive支持大量SQL数据定义语言(Data Manipulation Language,DML)中的现有功能,包括以下各种语句:

  使用where条件过滤表的行

  使用列或子查询的select表达式

  使用等值连接,连接多张表

  合并表的所有行或子查询

  针对多个“分组”的列进行聚合计算

  将查询结果存入另一张表

  导出表中的内容到本地目录或HDFS目录中

 

Hive支持的原生数据类型

  数值类型

    TINYINT (1字节有符号整型)  

    SMALLINT(2字节有符号整型)

    INT(4字节有符号整型)

    BIGINT(8字节有符号整型)

    FLOAT(4字节单精度浮点数)

    DOUBLE(8字节双精度浮点数)  

    DECIMAL(用户定义精度和尺寸)

 

  日期/时间类型

    TIMESTAMP(传统的UNIX时间戳,精度到纳秒)

    DATE(使用YYYY-MM-DD格式的日期,没有时刻信息)

    

  字符串类型

    STRING(不指定长度)

    VARCHAR(1~65535个字符)

    CHAR(1~225个字符,固定长度,不足255长度会在末尾补齐空格)

 

  其他类型

    BOOLEAN

    BINARY

 

 

 

Hive支持的符合数据类型

  Struct:不同类型数据的集合

  Array:相同类型的集合

  Map:键值对数据类型的集合

 

 

 

 

    

QUERY

  3、QUERY:数据查询语句,主要是SELECT语句。


本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6105543.html,如需转载请自行联系原作者

相关文章
|
2月前
|
SQL 分布式计算 Hadoop
手把手的教你搭建hadoop、hive
手把手的教你搭建hadoop、hive
106 1
|
2月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
46 4
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
58 3
|
2月前
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
48 2
|
2月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
37 2
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
89 0
|
7月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
194 1
|
7月前
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
269 0
|
2月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
37 0
|
5月前
|
SQL 分布式计算 大数据
大数据处理平台Hive详解
【7月更文挑战第15天】Hive作为基于Hadoop的数据仓库工具,在大数据处理和分析领域发挥着重要作用。通过提供类SQL的查询语言,Hive降低了数据处理的门槛,使得具有SQL背景的开发者可以轻松地处理大规模数据。然而,Hive也存在查询延迟高、表达能力有限等缺点,需要在实际应用中根据具体场景和需求进行选择和优化。
下一篇
无影云桌面