Hive部署

本文涉及的产品
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用版 2核4GB 50GB
简介:

什么是 Hive
        Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序
        
        常见的数据分析引擎: Hive, Pig,  Impala,  Spark SQL
        Hive 是一个基于Hadoop 之上的数据分析引擎(数据仓库)

        Hives               HDFS
         表      --------> 目录
        数据    --------> 文件
        分区    --------> 目录


环境部署:

    部署前准备:

    环境变量:vi ~/.bash_profile
        HIVE_HOME=/root/training/apache-hive-2.3.0-bin
        export HIVE_HOME

        PATH=$HIVE_HOME/bin:$PATH
        export PATH


     嵌入式部署:
        (1)使用Hive自带的Derby数据库来存储元信息
        (2)Hive只支持一个连接
             创建 conf/hive-site.xml
                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:derby:;databaseName=metastore_db;create=true</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>org.apache.derby.jdbc.EmbeddedDriver</value>
                    </property>    

                    <property>
                      <name>hive.metastore.local</name>
                      <value>true</value>
                    </property>    

                    <property>
                      <name>hive.metastore.warehouse.dir</name>
                      <value>file:///root/training/apache-hive-2.3.0-bin/warehouse</value>
                    </property>        
                </configuration>    

            初始化MetaStore:
            schematool -dbType derby -initSchema



     远程模式(需要MySQL数据库):

            1. 安装 MySQL数据库(此处省略)

            2. 配置 hive-site.xml  (JDBC的参数)

                <?xml version="1.0" encoding="UTF-8" standalone="no"?>
                <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
                <configuration>             
                    <property>
                      <name>javax.jdo.option.ConnectionURL</name>
                      <value>jdbc:mysql://localhost:3306/hive?useSSL=false</value>
                    </property>    

                    <property>
                      <name>javax.jdo.option.ConnectionDriverName</name>
                      <value>com.mysql.jdbc.Driver</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionUserName</name>
                      <value>hiveowner</value>
                    </property>    
                    
                    <property>
                      <name>javax.jdo.option.ConnectionPassword</name>
                      <value>Welcome_1</value>
                    </property>    
                    
                </configuration>

            3. 把MySQL 数据库的驱动放到: Hive/lib 下

            4. 初始化 MySQL数据库

                老版本的hive 在第一次运行时自动初始化 MySQL数据库

                新版本的hive 需要执行命令:

                    schematool   -dbType  mysql  -initSchema




本文转自 菜鸟的征程 51CTO博客,原文链接:http://blog.51cto.com/songqinglong/2055914


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
SQL 分布式计算 Java
bigdata-17-Hive部署与Hive基础
bigdata-17-Hive部署与Hive基础
78 0
|
8月前
|
SQL 分布式计算 Hadoop
Hive部署
Hive部署
85 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hive安装
Hive安装
77 1
|
8月前
|
SQL 存储 Java
45 Hive架构
45 Hive架构
27 0
|
SQL 存储 分布式计算
|
SQL 存储 分布式计算
hive的安装(一)
hive的安装(一)
hive的安装(一)
|
SQL 分布式计算 Hadoop
hive的安装(二)
hive的安装(二)
hive的安装(二)
|
SQL JSON 关系型数据库
Hive开发问题汇总
总结一下平时hive开发中遇见的常见问题,供大家参考
468 0
|
SQL 存储 数据库
Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储(来自学习资料)
1.1 Hive简介 1.1.1   什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 1.1.2   为什么使用Hive Ø  直接使用hadoop所面临的问题 人员学习成本太高 项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大   Ø  为什么要使用Hive 操作接口采用类SQ
26390 0
|
SQL 分布式计算 关系型数据库
【Hive】(二)Hive 安装部署
【Hive】(二)Hive 安装部署
240 0