数据迁移的工具Sqoop的安装与配置

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 数据迁移的工具Sqoop的安装与配置

0x00 教程内容


  1. Sqoop的获取与上传
  2. 安装并校验Sqoop
  3. 导入Mysql的movie表到Hive


0x01 Sqoop的获取与上传


1. 官网下载

a. 为了统一,此处下载sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz版本:

http://mirrors.hust.edu.cn/apache/sqoop/1.4.7/


2. 上传安装包到节点

a. 上传到master的/home/hadoop-sny/software上,没有目录则创建:

mkdir ~/software


0x02 安装并校验Sqoop


1. 解压Sqoop安装包

a. 解压/home/hadoop-sny/software到bigdata目录

tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C ~/bigdata/


2. 配置Sqoop

a. 配置环境变量

vi ~/.bash_profile


export SQOOP_HOME=/home/hadoop-sny/bigdata/sqoop-1.4.7.bin__hadoop-2.6.0
PATH=PATH:$SQOOP_HOME/bin


source ~/.bash_profile

b. 将mysql的jdbc驱动jar包扔到$SQOOP_HOME/lib下

3. 校验Sqoop是否安装成功

a. 执行:

sqoop help

说明安装成功。


0x03 导入Mysql的movie表到Hive


1. 启动HDFS与YARN

a. 命令:

start-dfs.sh

start-yarn.sh

2. 执行Sqoop操作

a. 简单的sqoop例子

sqoop import --connect jdbc:mysql://master:3306/movie --username root --password root --table movie --split-by id


说明:

master上已经装好了mysql,且建好了movie表,Mysql的账户与密码都是root

解释:

此操作为按id切割,导入Mysql的movie数据到Hive中。


0xFF 总结


  1. sqoop有1版本与2版本,此处是1版本,自行搜查1与2有哪些区别。
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
SQL 分布式计算 监控
Sqoop数据迁移工具使用与优化技巧:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入解析Sqoop的使用、优化及面试策略。内容涵盖Sqoop基础,包括安装配置、命令行操作、与Hadoop生态集成和连接器配置。讨论数据迁移优化技巧,如数据切分、压缩编码、转换过滤及性能监控。此外,还涉及面试中对Sqoop与其他ETL工具的对比、实际项目挑战及未来发展趋势的讨论。通过代码示例展示了从MySQL到HDFS的数据迁移。本文旨在帮助读者在面试中展现Sqoop技术实力。
1147 2
|
SQL 分布式计算 关系型数据库
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
Hadoop-21 Sqoop 数据迁移工具 简介与环境配置 云服务器 ETL工具 MySQL与Hive数据互相迁移 导入导出
439 3
|
SQL 关系型数据库 HIVE
sqoop笔记——一次从Hive到PostgreSql的数据迁移
sqoop笔记——一次从Hive到PostgreSql的数据迁移
753 0
|
缓存 关系型数据库 MySQL
Centos7 mysql和sqoop数据迁移
Centos7 mysql和sqoop数据迁移
|
SQL 分布式计算 关系型数据库
【数据采集与预处理】数据传输工具Sqoop
【数据采集与预处理】数据传输工具Sqoop
|
数据采集 消息中间件 分布式计算
Sqoop与其他数据采集工具的比较分析
Sqoop与其他数据采集工具的比较分析
|
数据采集 SQL 分布式计算
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
3599 0
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
439 0
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
269 0
|
SQL 分布式计算 关系型数据库
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
358 0

热门文章

最新文章