数据迁移的工具Sqoop的安装与配置

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介: 数据迁移的工具Sqoop的安装与配置

0x00 教程内容


  1. Sqoop的获取与上传
  2. 安装并校验Sqoop
  3. 导入Mysql的movie表到Hive


0x01 Sqoop的获取与上传


1. 官网下载

a. 为了统一,此处下载sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz版本:

http://mirrors.hust.edu.cn/apache/sqoop/1.4.7/


2. 上传安装包到节点

a. 上传到master的/home/hadoop-sny/software上,没有目录则创建:

mkdir ~/software


0x02 安装并校验Sqoop


1. 解压Sqoop安装包

a. 解压/home/hadoop-sny/software到bigdata目录

tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C ~/bigdata/


2. 配置Sqoop

a. 配置环境变量

vi ~/.bash_profile


export SQOOP_HOME=/home/hadoop-sny/bigdata/sqoop-1.4.7.bin__hadoop-2.6.0
PATH=PATH:$SQOOP_HOME/bin


source ~/.bash_profile

b. 将mysql的jdbc驱动jar包扔到$SQOOP_HOME/lib下

3. 校验Sqoop是否安装成功

a. 执行:

sqoop help

说明安装成功。


0x03 导入Mysql的movie表到Hive


1. 启动HDFS与YARN

a. 命令:

start-dfs.sh

start-yarn.sh

2. 执行Sqoop操作

a. 简单的sqoop例子

sqoop import --connect jdbc:mysql://master:3306/movie --username root --password root --table movie --split-by id


说明:

master上已经装好了mysql,且建好了movie表,Mysql的账户与密码都是root

解释:

此操作为按id切割,导入Mysql的movie数据到Hive中。


0xFF 总结


  1. sqoop有1版本与2版本,此处是1版本,自行搜查1与2有哪些区别。
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
18天前
|
SQL 分布式计算 监控
Sqoop数据迁移工具使用与优化技巧:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入解析Sqoop的使用、优化及面试策略。内容涵盖Sqoop基础,包括安装配置、命令行操作、与Hadoop生态集成和连接器配置。讨论数据迁移优化技巧,如数据切分、压缩编码、转换过滤及性能监控。此外,还涉及面试中对Sqoop与其他ETL工具的对比、实际项目挑战及未来发展趋势的讨论。通过代码示例展示了从MySQL到HDFS的数据迁移。本文旨在帮助读者在面试中展现Sqoop技术实力。
61 2
|
6月前
|
分布式计算 Java 关系型数据库
73 sqoop安装
73 sqoop安装
28 2
|
6月前
|
SQL 分布式计算 Hadoop
72 sqoop数据迁移概述
72 sqoop数据迁移概述
26 2
|
7月前
|
分布式计算 关系型数据库 MySQL
Sqoop实操案例-互联网招聘数据迁移
Sqoop实操案例-互联网招聘数据迁移
57 0
|
10月前
|
数据采集 SQL 分布式计算
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
1010 0
|
4月前
|
数据采集 消息中间件 分布式计算
Sqoop与其他数据采集工具的比较分析
Sqoop与其他数据采集工具的比较分析
|
4月前
|
分布式计算 Hadoop 关系型数据库
Sqoop入门指南:安装和配置
Sqoop入门指南:安装和配置
|
5月前
|
SQL 分布式计算 关系型数据库
sqoop快速安装
sqoop快速安装
24 0
|
7月前
|
存储 分布式计算 关系型数据库
大数据组件Sqoop-安装与验证
大数据组件Sqoop-安装与验证
73 0
|
10月前
|
SQL 分布式计算 Ubuntu
【大数据】Sqoop的安装及使用
【大数据】Sqoop的安装及使用
646 0