Hive部署

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

什么是 Hive
        Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序
        
        常见的数据分析引擎: Hive, Pig,  Impala,  Spark SQL
        Hive 是一个基于Hadoop 之上的数据分析引擎(数据仓库)

        Hives               HDFS
         表      --------> 目录
        数据    --------> 文件
        分区    --------> 目录


环境部署:

    部署前准备:

    环境变量:vi ~/.bash_profile
        HIVE_HOME=/root/training/apache-hive-2.3.0-bin
        export HIVE_HOME

        PATH=$HIVE_HOME/bin:$PATH
        export PATH


     嵌入式部署:
        (1)使用Hive自带的Derby数据库来存储元信息
        (2)Hive只支持一个连接
             创建 conf/hive-site.xml
                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:derby:;databaseName=metastore_db;create=true</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>org.apache.derby.jdbc.EmbeddedDriver</value>
                    </property>    

                    <property>
                      <name>hive.metastore.local</name>
                      <value>true</value>
                    </property>    

                    <property>
                      <name>hive.metastore.warehouse.dir</name>
                      <value>file:///root/training/apache-hive-2.3.0-bin/warehouse</value>
                    </property>        
                </configuration>    

            初始化MetaStore:
            schematool -dbType derby -initSchema



     远程模式(需要MySQL数据库):

            1. 安装 MySQL数据库(此处省略)

            2. 配置 hive-site.xml  (JDBC的参数)

                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:mysql://localhost:3306/hive?useSSL=false</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>com.mysql.jdbc.Driver</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionUserName</name>
                      <value>hiveowner</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionPassword</name>
                      <value>Welcome_1</value>
                    </property>    
                    
                </configuration>

            3. 把MySQL 数据库的驱动放到: Hive/lib 下

            4. 初始化 MySQL数据库

                老版本的hive 在第一次运行时自动初始化 MySQL数据库

                新版本的hive 需要执行命令:

                    schematool   -dbType  mysql  -initSchema

本文转自   tianshuai369   51CTO博客,原文链接:http://blog.51cto.com/songqinglong/2055914


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
SQL 分布式计算 Java
bigdata-17-Hive部署与Hive基础
bigdata-17-Hive部署与Hive基础
302 0
|
SQL 分布式计算 Hadoop
Hive部署
Hive部署
299 0
|
SQL 消息中间件 Kafka
Flink部署问题之hive表没有数据如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
SQL 存储 分布式计算
基于Hadoop数据仓库Hive1.2部署及使用
基于Hadoop数据仓库Hive1.2部署及使用
|
SQL 分布式计算 关系型数据库
hadoop搭建、mysql、hive部署(三)
hadoop搭建、mysql、hive部署
359 0
hadoop搭建、mysql、hive部署(三)
|
SQL 分布式计算 关系型数据库
hadoop搭建、mysql、hive部署(二)
hadoop搭建、mysql、hive部署
240 0
|
SQL 分布式计算 Hadoop
hadoop搭建、mysql、hive部署(一)
hadoop搭建、mysql、hive部署
302 0
|
SQL 存储 分布式计算
Hive详解以及CentOS下部署Hive和Mysql
Hive详解以及CentOS下部署Hive和Mysql
722 0
Hive详解以及CentOS下部署Hive和Mysql
|
SQL 存储 分布式计算
工良出品:包教会,Hadoop、Hive 搭建部署简易教程
导读 Hadoop、Hive 是什么 运行环境 Java 环境 Mysql 下载 Hadoop、Hive 和 驱动 安装 Hadoop core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml hadoop-env.cmd 启动 Hadoop 安装 Hive 配置 Hive hive-env.sh hive-site.xml 运行 Hive 连接到 Hive
659 0
|
SQL 存储 分布式计算
大数据技术基础实验九:Hive实验——部署Hive
大数据技术基础实验九,了解有关Hive的知识和学习如何在虚拟机上部署Hive并启动Hive。
687 0
大数据技术基础实验九:Hive实验——部署Hive