Hive实践

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 准备wget http://mirror.bit.edu.cn/apahce/hive/hive-0.11.0/hive-0.11.0-bin.tar.gztar -zxvf hive-0.

准备

wget http://mirror.bit.edu.cn/apahce/hive/hive-0.11.0/hive-0.11.0-bin.tar.gz
tar -zxvf hive-0.11.0-bin.tar.gz
cd hive-0.11.0-bin
sudo vi /etc/profile

 - export HIVE_HOME=/usr/hive-0.11.0-bin
 - export PATH     =$PATH:$HIVE/bin
hadoop fs -mkdir /tmp
hadoop fs -mkdir /user/hive/warehouse
hadoop fs -chmod g+w /tmp
hadoop fs -chmod g+w /user/hive/warehouse
cp conf/hive-log4j-properties.template conf/hive-log4j/properties
local模式:set mapred.job.tracker=local;
hadoop集群模式:set mapred.job.traker=host001:9001;
hive 相关:
create table demo (key int,value string) row format delimited fields terminated by '='stored as textfile;
加载数据到表demo:
load data local inpath '/usr/hive-0.11.0-bin/data.txt'into table demo;
查询:
select * from demo;
select * from demo where key>=100 and key <=120;
seclet *,count(*)as fre from demo group by value order by fre desc;
  • 配置metastore 使用Mysql
sudo apt-get install mysql-server mysql-client 
grant all privileges on *.* to 'root'@'%'with grant option;
sudo vi /etc/mysql/my.cnf
 - 注释 bind-address =127.0.0.1
 - mysql -uroot -psyc
vi conf/hive-site.xml
<?xml version = "1.0"?>
<?xml-stylesheet type = "text/xsl" href ="configuration.xsl"?>
<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://host001:3306/hive?createDatabaseIfNotExis=true</value>
    </property>
     <name>javax.jdo.option.ConnectionDriverName</name>
     <value>com.mysql.jdbc.Driver</value>
    <property>
    </property>
     <name>javax.jdo.option.ConnectionUserName</name>
     <value>root</value>
    <property>
     <name>javax.jdo.option.ConnectionPassWord</name>
     <value>root</value>
    </property>
</configuration>
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
目录
相关文章
|
SQL 大数据 HIVE
Hive 任务调优实践总结
Hive 任务调优实践总结
143 0
|
3月前
|
存储 SQL Apache
网易云信 x Doris:降本70%、提速11倍, 统一 ES/InfluxDB/Hive 多技术栈的落地实践
网易云信引入 Apache Doris 统一了原有 Elasticsearch、InfluxDB 和 Hive 多技术栈系统。凭借其高性能和易扩展的特点,提供一站式的数据存储和分析服务。实现机器成本降低 70%、实时场景查询提速 11 倍、离线任务耗时缩短 80% 的显著收益。
269 0
|
SQL 关系型数据库 MySQL
Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
【2月更文挑战第9天】Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
485 7
|
SQL 数据采集 存储
Hive SQL 迁移 Flink SQL 在快手的实践
快手数据架构工程师张芒,阿里云工程师刘大龙,在 Flink Forward Asia 2022 生产实践专场的分享。
841 1
Hive SQL 迁移 Flink SQL 在快手的实践
|
SQL 存储 关系型数据库
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
1622 0
|
SQL 分布式计算 Java
阿里云MaxCompute-Hive UDF(Java)迁移上云实践
阿里云MaxCompute-Hive UDF(Java)迁移上云实践
|
SQL 存储 分布式计算
《离线和实时大数据开发实战》(五)Hive 优化实践1
《离线和实时大数据开发实战》(五)Hive 优化实践1
654 0
《离线和实时大数据开发实战》(五)Hive 优化实践1
|
SQL 分布式计算 大数据
《离线和实时大数据开发实战》(五)Hive 优化实践2
《离线和实时大数据开发实战》(五)Hive 优化实践2
300 0
《离线和实时大数据开发实战》(五)Hive 优化实践2
|
SQL 缓存 分布式计算
《离线和实时大数据开发实战》(四)Hive 原理实践2
《离线和实时大数据开发实战》(四)Hive 原理实践2
422 0
《离线和实时大数据开发实战》(四)Hive 原理实践2
|
SQL 存储 分布式计算
《离线和实时大数据开发实战》(四)Hive 原理实践1
《离线和实时大数据开发实战》(四)Hive 原理实践1
371 0
《离线和实时大数据开发实战》(四)Hive 原理实践1