sqoop的安装和使用

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: sqoop的安装和使用

一、 任务描述

本实验通过练习sqoop的安装和配置,为学习sqoop准备,并且通过练习将mysql中表的数据导入到HDFS上来对sqoop的使用有一个初步的了解。


二、 任务目标

完成sqoop的安装和配置并且练习将mysql数据库里的数据导入到HDFS中。


三、 任务环境

本次环境是:Ubuntu16.04+ jdk1.8.0_73 + hadoop2.7.3 + sqoop-1.4.6 +mysql-5.7.22


四、 任务分析

解压sqoop安装包然后进行配置后,在sqoop的bin目录下输入命令【./sqoop】检查是否配置成功。然后在mysql中创建表并添加数据最后导入到HDFS中进行查看。


五、 任务实施

步骤1、Sqoop安装包的解压

右击桌面上选择【Open Terminal Here】打开终端。在弹出的终端中输入【cd /simple/soft】进入软件包的所在文件夹中,并通过【ls】查看文件夹下所有软件。如图1所示。

39e19622e12c43a6800075067e69897d.png



图1 查看所需jar包


返回到simple目录,在simple目录下执行命令【tar -zxvf /simple/soft/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz】解压sqoop如图2所示。

注:打开终端的方法,右击桌面选择“在终端中打开“


106886d3038e4491a25915899f9c5420.png


图2 解压jar包

 查看解压的文件并改名为sqoop


c1c2509d8345417ea05823380760deb2.png


图3 为sqoop改名

♥ 知识链接

sqoop介绍

 sqoop架构非常简单,其整合了Hive、Hbase和Oozie,通过map-reduce任务来传输数据,从而提供并发特性和容错。

sqoop主要通过JDBC和关系数据库进行交互。理论上支持JDBC的database都可以使用sqoop和hdfs进行数据交互。


步骤2、Sqoop配置

把桌面上的mysql的jdbc驱动包mysql-connector-java-5.1.45.jar复制到sqoop安装目录下的lib文件夹下。


eb9192ebcd7a454faaa03626c9a383f4.png


图4 拷贝所需jar包到sqoop目录


在终端输入【vim /etc/profile】配置环境变量,



4623275cfc1d419295d3ccd98e07a54f.png

图5 配置环境变量


在终端输入【source /etc/profile】使文件生效。如图6所示:


bb9b936174d343da9b01eac603391ed9.png


图6 使配置生效


将sqoop-env-template.sh重命名为sqoop-env.sh,如图7所示


a10772eb6e414bfe8e5944b81e2175bd.png


图7 重命名配置文件

 修改sqoop-env.sh的属性,执行命令: 【vim sqoop-env.sh】。如图8所示。

添加相关的配置,注意:当你装了什么工具就配置什么工具路径。按“i“键进入插入操作,按“esc“退出插入操作,输入“:wq!“回车保存并退出。


4d6f5ccf41d34804a7d7447eebb0bbf8.png

图8 编辑配置文件

 修改/simple/sqoop/bin/configure-sqoop里面的配置,进入到/simple/sqoop/bin目录下执行命令:【vim configure-sqoop】。如图9所示

afce6ed8861f486da4a3ba11369f9702.png


图9 进入configure-sqoop文件

 注释掉HCatalog等不用的组件。如图10


9dc9e1a916914010bc7ab06266e0882d.png


图10 注释掉不用的配置

 启动mysql服务器,如图11所示


0ed83fe3c97f408cacf5e5581456b647.png


图11 启动mysql服务器


♥ 知识链接

mysql密码设置

 如果mysql没有设置密码,可通过如下步骤进行设置

 1)use mysql

 2)set password for “root“@“localhost“ = password(“root“);

 启动sqoop,在${sqoop}的bin目录下有一个sqoop。执行命令:./sqoop。如图12所示:

834d1ae068b54f0ab306e946781d6234.png


图12 启动sqoop

 输入命令【./sqoop list-databases --connect jdbc:mysql://localhost:3306/ --username root --password root】链接mysql数据库,列出数据库列表:如图13所示

8bf6d19541e9408b9c9f74738a12ab03.png


图13 列出数据库表

 通过以上几步可以检查出hadoop、mysql、和sqoop是否已经安装成功,并且可以通过sqoop连接到mysql中。

六、 任务测试

启动hadoop服务,启动完成后【jps】查看启动服务。如图14所示


c65bfcf358fb4285890cb7434d2f5594.png

图14 启动hadoop服务并查看


使用root用户进入mysql数据库,使用命令【create database sqooptest】创建新的数据库sqooptest,并使用命令【use sqooptest】选中sqooptest数据库。如图15所示


b4540b3a4add49aa85f6eb5ab091ce65.png


图15 创建数据库并选中


在sqooptest数据库里创建表test, 并添加数据进去,最后检查一下,数据是否添加成功,如图16所示


4db576f839314022ae3b993b73859c96.png


图16 创建数据表


退出mysql命令行模式,在bin目录下输入命令【./sqoop import --connect jdbc:mysql://localhost:3306/sqooptest --username root --password root --table test -m 1 --target-dir /usr/local/hadoop/result】将数据从mysql导入到hdfs中去。如图17


cb8641b810ab45efbde0bc37d6508321.png


图17 mysql导入到hdfs

 导入成功后的结果如下图18所示

4f373535a7a8497aae7489b806c690e0.png


图18 成功结果图


在hadoop中检查数据是否导入到hdfs中。在当前的目录下输入命令【hadoop fs -ls /usr/local/hadoop/result】查看生成的文件,并且通过【hadoop fs -cat】命令查看文件内容。如图19所示


2a4ebeeb751742f38d26260f44aea5b8.png


图19 查看导入的文件


1ff07dff781f41bd994145d1bce8fbb1.png

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
分布式计算 Java 关系型数据库
73 sqoop安装
73 sqoop安装
59 2
|
8月前
|
分布式计算 Hadoop 关系型数据库
Sqoop入门指南:安装和配置
Sqoop入门指南:安装和配置
|
8月前
|
SQL 分布式计算 关系型数据库
sqoop快速安装
sqoop快速安装
77 0
|
存储 分布式计算 关系型数据库
大数据组件Sqoop-安装与验证
大数据组件Sqoop-安装与验证
159 0
|
SQL 分布式计算 Ubuntu
【大数据】Sqoop的安装及使用
【大数据】Sqoop的安装及使用
1245 0
|
SQL 分布式计算 Oracle
Sqoop的安装与数据的导入导出
Sqoop的安装与数据的导入导出
162 0
|
SQL 分布式计算 Oracle
【Sqoop】(一)Sqoop 概述及安装环境搭建
【Sqoop】(一)Sqoop 概述及安装环境搭建
451 0
【Sqoop】(一)Sqoop 概述及安装环境搭建
|
SQL 分布式计算 关系型数据库
四十、centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)
四十、centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)
四十、centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)
|
SQL 资源调度 关系型数据库
数据迁移的工具Sqoop的安装与配置
数据迁移的工具Sqoop的安装与配置
142 0

热门文章

最新文章