【hive】（星巴克开店数据集）将本地数据导入hive的表中，并完成一些数据的查询-阿里云开发者社区

【hive】（星巴克开店数据集）将本地数据导入hive的表中，并完成一些数据的查询

2022-08-22 161

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 将本地数据导入hive的表中，并完成一些数据的查询

题目：

1、在中国的星巴克有多少家

2、统计在各个国家和地区的星巴克开店数量

3、距离北极点（物理北极）最近的星巴克店是哪一家?

星巴克开店数据大致内容：

Brand 品牌

StoreNumber 店铺号码

StoreName 店铺名称

Ownership Type 所有权类型

StreetAddress 街道地址

City 店铺所在城市

State/Province 店铺所在州/省份

Country 店铺所在国家

Postcode 邮编

PhoneNumber 电话号码

Timezone 时区

Longitude 经度

Latitude 维度

# 一、创表并装载数据

<1.创建一个yiqianbin的表>

create table if not exists yiqianbin(

Brand string,

StoreNumber string,

StoreName string,

OwnershipType string,

StreetAddress string,

City string,

State string,

Country string,

Postcode string,

PhoneNumber int,

Timezone string,

Longitude float,

Latitude float)

row format SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'

WITH SERDEPROPERTIES("separatorChar" = ",","quoteChar"="\"","escapeChar" = "\\");

<2.加载数据>

load data local inpath '/home/yqb/hadoop_class/星巴克开店数据集.csv' overwrite into table yiqianbin;

<3.查询一下表以及数据是否成功导入>

# 二、完成练习

## 1.在中国的星巴克有多少家

select Country,count(1) as count from yiqianbin where Country='CN' group by Country order by count;

## 2.统计在各个国家和地区的星巴克开店数量

select Country,count(1) as count from yiqianbin group by Country order by count;

### 3.距离北极点（物理北极）最近的星巴克店是哪一家?

select max(float(Latitude)) from yiqianbin;

select StoreName from yiqianbin where Latitude='max(float(Latitude))' limit 1;

# 总结

对sql语句掌握的还远远不够

【hive】（星巴克开店数据集）将本地数据导入hive的表中，并完成一些数据的查询

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【hive】（星巴克开店数据集）将本地数据导入hive的表中，并完成一些数据的查询

热门文章

最新文章

相关课程

相关电子书

相关实验场景