Hive【基础知识 02-1】【Hive CLI 命令行工具使用】【准备阶段-建库、建表、导入数据、编写测试SQL脚本并上传HDFS】

简介: 【4月更文挑战第7天】Hive【基础知识 02-1】【Hive CLI 命令行工具使用】【准备阶段-建库、建表、导入数据、编写测试SQL脚本并上传HDFS】

why

【为了测试CLI和Beeline命令行工具,这里先创建一个数据库和表并导入一些数据】

1. 创建数据库

# 创建数据库
hive> CREATE DATABASE IF NOT EXISTS hive_test
    > COMMENT 'hive database for test'
    > LOCATION '/tmp/hive/test'
    > WITH DBPROPERTIES ('create'='yuanzhengme');
OK
Time taken: 0.453 seconds

可以看到HDFS的test目录已被创建:

在这里插入图片描述
可以看到MySQL数据库的元数据也被录入了:

在这里插入图片描述

2. 创建表

# 创建表 【这里不再贴出hive的日志】
hive> use hive_test;
hive> create table if not exists hive_test.word_count(word STRING, count INT) row format delimited fields terminated by ',' lines terminated by '\n' stored as textfile;

3. 导入数据

WordCount.txt 文件内容如下:

[root@tcloud wordCount]# cat ./WordCount.txt
spark,3
hive,3
hadoop,2
kafka,1
hbase,1
# 导入数据 【这里不再贴出hive的日志】
hive> load data local inpath '/home/spark/testFile/wordCount/WordCount.txt' overwrite into table word_count;

验证一下:

可以看到hdfs是已经有WordCount.txt文件了:

在这里插入图片描述
可以看到MySQL数据库的元数据也被录入了:

在这里插入图片描述验证一下:

hive> select * from word_count;
OK
spark   3
hive    3
hadoop  2
kafka   1
hbase   1
Time taken: 5.871 seconds, Fetched: 5 row(s)

4. 编写测试SQL脚本并上传HDFS

-- 其中  hive_test.sql 内容如下
select * from hive_test.word_count;

添加到hdfs:

[root@tcloud ~]# hdfs dfs -put /home/hive/testFile/hive_test.sql /tmp/hive/test

可以看到hdfs目标文件已经有hive_test.sql文件了:
在这里插入图片描述
读取一下:

[root@tcloud ~]# hdfs dfs -cat /tmp/hive/test/hive_test.sql
select * from hive_test.word_count;
目录
相关文章
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-13-Hive 启动Hive 修改启动参数命令行启动测试 几句简单的HQL了解Hive
Hadoop-13-Hive 启动Hive 修改启动参数命令行启动测试 几句简单的HQL了解Hive
72 2
|
2月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
57 4
|
2月前
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
89 3
|
2月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
43 2
|
3月前
|
SQL JavaScript 前端开发
基于Python访问Hive的pytest测试代码实现
根据《用Java、Python来开发Hive应用》一文,建立了使用Python、来开发Hive应用的方法,产生的代码如下
83 6
基于Python访问Hive的pytest测试代码实现
|
2月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
68 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
110 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
51 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
60 0
|
3月前
|
SQL JavaScript 前端开发
基于Java访问Hive的JUnit5测试代码实现
根据《用Java、Python来开发Hive应用》一文,建立了使用Java、来开发Hive应用的方法,产生的代码如下
82 6