Hive环境搭建

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 本文主要介绍hadoop基础环境(3.1.3) Hive版本 3.1.2搭建教程。

准备环境: hadoop基础环境(3.1.3) Hive版本 3.1.2
下载地址:https://hive.apache.org/downloads.html
Hive3.X版本支持Hadoop3.X,Hive2.0版本支持Hadoop2.X
1、上传安装包,解压文件
tar -zxvf 对应包名
2、 创建软连接

ln -s  apache-hive-1.2.2-bin hive

3、修改环境变量

vim ~/.bash_profile

修改完成使环境变量立即生效

source ~/.bash_profile

4、修改配置文件名

mv hive-env.sh.template hive-env.sh

5、进入该文件,配置hadoop路径与hive_conf路径
6、在hdfs上创建相关目录,附加相关权限

hdfs dfs -mkdir -p  /user/hive/warehouse
hdfs dfs -mkdir /tmp
hdfs dfs -chmod g+w /tmp  /user/hive/warehouse

7、启动hive(在此之前需要保证hdfs、yarn已启动)
这里需要注意
1)如果hadooplib中的相关jar包与hive中的jar包冲突会导致启动失败:相关问题见链接

2)执行查看库hql语句,一开始没有执行初始化库操作导致启动失败,hive存储元数据的默认库为derby。
https://blog.csdn.net/lz6363/article/details/95805446

初始化相关指令

schematool -dbType derby -initSchema

至此hive初步环境搭建完成。
8、更改hive存放元数据数据库为mysql,这里首先介绍mysql数据库的安装步骤
1)首先下载下载并安装MySQL官方的 Yum Repository

wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm

2)安装MySQL服务器

yum -y install mysql57-community-release-el7-10.noarch.rpm

3)启动mysql并查看mysql状态

systemctl start  mysqld.service
systemctl status mysqld.service

显示active,启动成功。
4)查看初始密码
grep "password" /var/log/mysqld.log
5)登录mysql数据库并修改密码
mysql -uroot -p
这里需要注意的是,如果密码设置过于简单会报错
原因是因为MySQL有密码设置的规范,具体是与validate_password_policy的值有关:

修改一下密码规则

set global validate_password_policy=0;
set global validate_password_length=1;

此时在修改密码就可以了
ALTER USER 'root'@'localhost' IDENTIFIED BY 'new password';
6)查看数据库
show databases;
9、 在hive/conf目录中创建文件 hive-site.xml

<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
      <value>jdbc:mysql://172.16.25.27:3306/metastore?createDatabaseIfNotExist=true</value>
        <description>JDBC connect string for a JDBC metastore</description>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
        <description>Driver class name for a JDBC metastore</description>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
        <description>username to use against metastore database</description>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>root</value>
        <description>password to use against metastore database</description>
    </property>
</configuration>

10、下载mysql驱动包,将相关依赖jar包导入到/hive/lib文件夹下
下载地址:https://dev.mysql.com/downloads/file/?id=496585
mysql 5.7 用8.0版本的驱动可以,5.1版本也可以
配置完毕,启动Hive,收工。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
9月前
|
SQL 存储 资源调度
Hive初体验
Hive初体验
49 0
|
9月前
|
SQL 分布式计算 关系型数据库
Hive教程(02)- Hive安装
Hive教程(02)- Hive安装
79 0
|
9月前
|
SQL 分布式计算 Hadoop
44 Hive简介
44 Hive简介
44 0
|
SQL 分布式计算 关系型数据库
Hive学习---1、Hive入门、Hive 安装(一)
Hive学习---1、Hive入门、Hive 安装(一)
|
SQL 关系型数据库 MySQL
Hive环境搭建及简单使用
上篇文章我们介绍了Hive源码编译的相关内容,本篇文章将主要介绍Hive环境的搭建步骤及简单使用。
245 0
|
SQL 分布式计算 关系型数据库
|
SQL 分布式计算 Java
Hive环境安装
Hive环境安装
141 0
|
SQL 关系型数据库 MySQL
CDH 搭建_Hive_搭建完成|学习笔记
快速学习 CDH 搭建_Hive_搭建完成
209 0
CDH 搭建_Hive_搭建完成|学习笔记
|
SQL 存储 分布式计算
Hive简介及源码编译
Hive是一个基于Hadoop的数据仓库,可以将结构化数据映射成一张表,并提供类SQL的功能,最初由Facebook提供,使用HQL作为查询接口、HDFS作为存储底层、MapReduce作为执行层,设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据,2008年facebook把Hive项目贡献给Apache。Hive提供了比较完整的SQL功能(本质是将SQL转换为MapReduce),自身最大的缺点就是执行速度慢。Hive有自身的元数据结构描述,可以使用MySql\ProstgreSql\oracle 等关系型数据库来进行存储,但请注意Hive中的所有数据都存储在HDFS中
404 0
Hive简介及源码编译
|
SQL 分布式计算 关系型数据库
【Hive】(二)Hive 安装部署
【Hive】(二)Hive 安装部署
243 0