CDH6.2版本的HIVE性能测试

2020-03-27 2445

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： CDH6.2版本的HIVE性能测试

服务器配置

当前hive通过群集方式安装，分别安装到node1-node3中，各主机的配置如下表：

主机	CPU	内存	硬盘
Node1	1颗1核	14G	14G
Node2	1颗1核	2G	14G
Node3	1颗1核	2G	14G

创建test数据库

1.    create table test(    
2.        name String,  
3.        gender String,  
4.        age String,  
5.        city String,  
6.        idNumber String,  
7.        cardNumber String,  
8.        balance String  
9.    )    
10.    row format delimited fields terminated by ',' lines terminated by '\n'  
stored as textfile;

测试10万条数据

使用createtestdata.jar生成10万条测试数据，并导入hdfs，使用命令行put到hdfs的/data目录，或使用hdfs帐户登录hue，上传至/data目录

1.    #切换至hdfs用户  
2.    su hdfs  
3.    #将文件testdata_10w.txt存入hdfs的/data目录  
4.    hadoop fs -put testdata_10w.txt /data  
5.    #查看目录情况  
6.    hadoop fs -ls /data

使用如下命令，将数据导入test表中

1.    load data inpath '/data/testdata_10w.txt' into table test;

执行sql语句，查询测试数据中各城市的人员年龄分布情况及总余额信息：

1.    SELECT  
2.        city AS city_name,  
3.        count(NAME) AS total_persons,  
4.        max(age) AS max_age,  
5.        min(age) AS min_age,  
6.        round(avg(age), 2) AS avg_age,  
7.        sum(balance) AS total_balance  
8.    FROM  
9.        test  
10.    GROUP BY  
11.        city

执行结果：31.93s

测试100万条数据

执行结果：43.827s

测试1000万条数据

执行结果：142.885s

测试1亿条数据

执行结果：1035.759s，约17分钟

测试结论

在当前服务器配置情况下，测试结果：

数据量	10万	100万	1000万	1亿
结果	31.93s	43.827s	142.885s	1035.759s

CDH6.2版本的HIVE性能测试

服务器配置

创建test数据库

测试10万条数据

测试100万条数据

测试1000万条数据

测试1亿条数据

测试结论

阿里云MVP

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

CDH6.2版本的HIVE性能测试

服务器配置

创建test数据库

测试10万条数据

测试100万条数据

测试1000万条数据

测试1亿条数据

测试结论

阿里云MVP

热门文章

最新文章

相关课程

相关电子书