Hadoop-21 Sqoop 数据迁移工具简介与环境配置云服务器 ETL工具 MySQL与Hive数据互相迁移导入导出-阿里云开发者社区

Hadoop-21 Sqoop 数据迁移工具简介与环境配置云服务器 ETL工具 MySQL与Hive数据互相迁移导入导出

2024-10-13 162

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS PostgreSQL，集群系列 2核4GB

简介： Hadoop-21 Sqoop 数据迁移工具简介与环境配置云服务器 ETL工具 MySQL与Hive数据互相迁移导入导出

章节内容

上一节我们已经完成了：

Flume 采集数据

Flume 3个Agent编写

Flume 双写：本地+HDFS

背景介绍

这里是三台公网云服务器，每台 2C4G，搭建一个Hadoop的学习环境，供我学习。

之前已经在 VM 虚拟机上搭建过一次，但是没留下笔记，这次趁着前几天薅羊毛的3台机器，赶紧尝试在公网上搭建体验一下。

2C4G 编号 h121

2C4G 编号 h122

2C2G 编号 h123

注意事项

Apache Sqoop 于 2021 年 6 月迁入 Attic。

Apache Sqoop 的使命是创建和维护与 Apache Hadoop 和结构化数据存储相关的大规模数据传输软件。

虽然项目已经可能过时，但是如果你的时间充裕的话，可以适当地学习一下，可能会对你有一定的帮助的！！！

Sqoop介绍

Sqoop 是一款开源的工具，主要用于在 Hadoop（Hive）与传统数据库（MySQL等）之间进行数据的传递。可以将关系型数据库：（MySQL等）中的数据导入到HDFS中，可以将HDFS中的数据导入到传统数据库中。

Sqoop项目开始与2009年，最早是Hadoop的一个第三方模块，后来为了让使用者快速部署，Sqoop独立成为了Apache的项目。

它将导入或导出命令转换为 MapReduce 程序来实现。

Sqoop下载

下载 1.4.7 版本，这是最后一个稳定的版本了。后续项目就迁移了。

http://www.apache.org/dyn/closer.lua/sqoop/

下载解压

我选择了 h122 机器，对其进行测试。

tar zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
mv sqoop-1.4.7.bin__hadoop-2.6.0/ ../servers/sqoop-1.4.7/

环境变量

vim /etc/profile

向其中写入如下内容

# sqoop
export SQOOP_HOME=/opt/servers/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

退出保存，并且刷新环境变量。

修改配置

cd $SQOOP_HOME/conf

我们需要修改默认的配置

cp sqoop-env-template.sh sqoop-env.sh
vim sqoop-env.sh

写入如下的内容：

export HADOOP_COMMON_HOME=/opt/servers/hadoop-2.9.2
export HADOOP_MAPRED_HOME=/opt/servers/hadoop-2.9.2
export HIVE_HOME=/opt/servers/hive-2.3.9

修改结果如下图：

测试结果

控制台测试：

sqoop version

额外配置

JDBC配置

JDBC驱动需要拷贝到 lib 目录下，由于当前节点是我的Hive节点，之前我已经拷贝过 JDBC 驱动了，这里我从Hive的目录直接拷贝过来即可。

cp $HIVE_HOME/lib/mysql-connector-java-8.0.19.jar $SQOOP_HOME/lib

Hive配置

Hive驱动也是，如果我们需要链接到Hive，那也需要拷贝一些支持库过来。

cp $HIVE_HOME/lib/hive-*-2.3.9.jar $SQOOP_HOME/lib/

Hadoop配置

Hadoop 配置同理，这里缺一个Jar包，拷贝一下过来。（不然后续会报错！）

cp $HADOOP_HOME/share/hadoop/tools/lib/json-20170516.jar $SQOOP_HOME/lib

Hadoop-21 Sqoop 数据迁移工具简介与环境配置云服务器 ETL工具 MySQL与Hive数据互相迁移导入导出

Sqoop下载

下载解压

环境变量

修改配置

测试结果

额外配置

Hive配置

Hadoop配置

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出

Sqoop下载

下载解压

环境变量

修改配置

测试结果

额外配置

Hive配置

Hadoop配置

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

Hadoop-21 Sqoop 数据迁移工具简介与环境配置云服务器 ETL工具 MySQL与Hive数据互相迁移导入导出