四十、centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS Agent(兼容OpenClaw),2核4GB
RDS AI 助手,专业版
简介: 四十、centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)

环境准备:


centos 7


centos 可以上网


hadoop,Hbase,Hive,Zookeeper正常运行


环境搭建:


版本:


sqoop1.4.7-hadoop2.6.0


一、Sqoop安装

   

1、直接在虚拟机浏览器下载sqoop1.4.7


https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

46.png

47.png



       2、解压安装包


48.png


       3、重命名为Sqoop


mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop

49.png


       4、配置sqoop-env.sh


               (1)复制配置文件并重命名为sqoop-env.sh


cat sqoop-env-template.sh >> sqoop-env.sh

50.png

                 (2)修改配置文件


       编辑sqoop-env.sh文件,分别将Hadoop、HBase、Hive、ZooKeeper的安装目录添加到文件中。


51.png

52.png


       5、配置环境变量


vim /etc/profile

53.png


       使环境变量立即生效:


source /etc/profile

       6、配置MySQL连接


               (1)添加MySQL的JAR包到Sqoop安装目录中。


54.png


                (2)测试Sqoop与MySQL之间的连接


                        A、启动MySQL服务:


55.png


                        B、测试Sqoop与MySQL之间的连接是否成功:


sqoop list-databases --connect jdbc:mysql://localhost:3306 --username root -password dang

56.png


        注:如果可以看到MySQL数据库中的数据库列表,则表示Sqoop安装成功


centos安装Sqoop完成


Sqoop的使用:


二、使用Sqoop完成MySQL和HDFS之间的数据互导

     

1、上传准备好的测试数据到MySQL中


               (1)登录MySQL:


57.png


              (2)创建测试数据库


58.png


               (3)创建表test1,用于存放本地测试数据


create table test1(
     ip varchar(100) not null,
     time varchar(100) not null,
     url varchar(100) not null);

59.png


               (4)新建测试数据文件


60.png


               写入:


61.png


        注意:此 txt 文件字段之间需要用Tab键隔开,空格是不可行的,遇到datatime日期的,年月日,时分秒之间需用空格隔开,不需要添加引号


                (5)将本地的测试数据上传到test1表中


load data local infile "/opt/linshi/test.txt" into table test1(ip,time,url);


62.png

           


               (6)上传完成后,查看test1表中的数据:  


select * from test1;

select * from test1;


63.png

       2、上传数据到HDFS中


       (1)启动hadoop集群                


64.png


       (2)将test1中的数据上传到HDFS中:


./sqoop import --connect jdbc:mysql://localhost:3306/test --username root --password dang --table test1 -m 1

       (3)查看导入的数据


hdfs dfs -cat /user/root/test1/part-m-00000

65.png


       (4)登录HDFS网页查看


       HDFS的web端:localhost:50070


66.png



        (5)将HDFS数据导入MySQL中


       注:在导出前需要先创建导出表的结构,如果导出的表在数据表中不存在,则系统会报错;若重复导出数据,则表中的数据会重复


                A、 在test数据库中创建表test2,可以直接复制表test1的结构:


create table test2 as select * from test1 where 1=2;

67.png


               B、查看表test1,表test2:


68.png


               C、使用sqoop将HDFS中的数据导入MySQL的test2中:


sqoop export --connect jdbc:mysql://192.168.231.105:3306/test --username root --password dang --table test2 --export-dir /user/root/test1/part-m-00000 -m 1

69.png


        注:localhost最好写成本机地址,之前写的localhost报错了


       (6)再次查看test2表:


70.png



       HDFS的数据成功导入test2


一条华丽的分割线


centos安装sqoop(使用Sqoop完成MySQL和HDFS之间的数据互导)案例完成


其他环境搭建参见:


Hadoop伪分布式的搭建详情

https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502


Hadoop完全分布式的搭建详情

https://blog.csdn.net/m0_54925305/article/details/118851554?spm=1001.2014.3001.5502


Zookeeper集群的搭建(单机、伪分布式、集群)

https://blog.csdn.net/m0_54925305/article/details/119059186?spm=1001.2014.3001.5502


Spark的安装与部署详情(Local模式,Standalone模式,Spank on YARN模式)

https://blog.csdn.net/m0_54925305/article/details/119005751?spm=1001.2014.3001.5502


HadoopHA环境搭建(保姆篇,手把手搭建)

https://blog.csdn.net/m0_54925305/article/details/119838463?spm=1001.2014.3001.5502


hbase集群的搭建(HBase Shell)

https://blog.csdn.net/m0_54925305/article/details/120787788?spm=1001.2014.3001.5502


Centos安装mysql(rpm终结版)

https://blog.csdn.net/m0_54925305/article/details/120476116?spm=1001.2014.3001.5502


centos安装hive3.1.2(精讲篇)

https://blog.csdn.net/m0_54925305/article/details/120554242?spm=1001.2014.3001.5502


Centos安装yum,wegt(完全配置篇)

https://blog.csdn.net/m0_54925305/article/details/120467143?spm=1001.2014.3001.5502


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
10月前
|
存储 Ubuntu Linux
VMware-安装CentOS系统教程及安装包
虚拟机相当于是一个独立于你电脑的环境,在这个环境上面,你可以安装Linux、Windows、Ubuntu等各个类型各个版本的系统,在这个系统里面你不用担心有病读等,不用担心文件误删导致系统崩溃。 虚拟机也和正常的电脑系统是一样的,也可以开关机,不用的时候,你关机就可以了,也不会占用你的系统资源,使用起来还是比较方便 这里也有已经做好的CentOS 7系统,下载下来解压后直接用VMware打开就可以使用
1595 69
|
9月前
|
存储 分布式计算 Linux
安装篇--CentOS 7 虚拟机安装
VMware 装 CentOS 7 不知道从哪下手?这篇超详细图文教程手把手教你在 VMware Workstation 中完成 CentOS 7 桌面系统的完整安装流程。从 ISO 镜像下载、虚拟机配置,到安装图形界面、设置用户密码,每一步都有截图讲解,适合零基础新手快速上手。装好之后无论你是要搭 Hadoop 集群,还是练 Linux ,这个环境都够你折腾一整天!
3953 3
|
10月前
|
Ubuntu Linux 索引
Centos 7、Debian及Ubuntu系统中安装和验证tree命令的指南。
通过上述步骤,我们可以在CentOS 7、Debian和Ubuntu系统中安装并验证 `tree`命令。在命令行界面中执行安装命令,然后通过版本检查确认安装成功。这保证了在多个平台上 `tree`命令的一致性和可用性,使得用户无论在哪种Linux发行版上都能使用此工具浏览目录结构。
889 78
|
11月前
|
Linux 网络安全 Apache
针对在Centos/Linux安装Apache过程中出现的常见问题集锦
以上每个问题的解决方案应深入分析错误日志、系统消息和各种配置文件,以找到根本原因并加以解决。务必保持系统和Apache软件包更新到最新版本,以修复已知的bugs和安全漏洞。安装和管理Web服务器是一项需要细致关注和不断学习的任务。随着技术的发展,推荐定期查看官方文档和社区论坛,以保持知识的更新。
413 80
|
9月前
|
安全 关系型数据库 MySQL
CentOS 7 yum 安装 MySQL教程
在CentOS 7上安装MySQL 8,其实流程很清晰。首先通过官方Yum仓库来安装服务,然后启动并设为开机自启。最重要的环节是首次安全设置:需要先从日志里找到临时密码来登录,再修改成你自己的密码,并为远程连接创建用户和授权。最后,也别忘了在服务器防火墙上放行3306端口,这样远程才能连上。
2243 16
|
10月前
|
存储 关系型数据库 MySQL
在CentOS 8.x上安装Percona Xtrabackup工具备份MySQL数据步骤。
以上就是在CentOS8.x上通过Perconaxtabbackup工具对Mysql进行高效率、高可靠性、无锁定影响地实现在线快速全量及增加式数据库资料保存与恢复流程。通过以上流程可以有效地将Mysql相关资料按需求完成定期或不定期地保存与灾难恢复需求。
745 10
|
12月前
|
机器人 Linux
CentOS 7系统中安装特定版本CMake 3.21.2的方法。
到这里,过程已经全部完成。如果你跟随上面的步骤来,那么你现在已经拥有了一个全新的CMake版本在你的CentOS 7系统上了。这个过程就像是你通过一系列仪式,唤醒了一个沉睡已久的古老机器人,它现在完全按照你的意愿来帮你构建和编译软件了。
788 18
|
11月前
|
人工智能 数据挖掘 Linux
Centos安装Python3.7(亲测可用)
本指南详细介绍了在基于Linux(以CentOS系统为例,使用yum包管理器)的系统上安装Python 3.7版本的完整流程。Python是一种广泛使用的高级编程语言,在各种领域如软件开发、数据分析、人工智能和区块链开发等都有着重要的应用。
883 2
|
10月前
|
运维 网络协议 Linux
CentOS下Bind服务的安装与故障排查
通过以上的步骤,您应该能够在CentOS系统上安装并配置BIND DNS服务,并进行基本的故障排查。
771 0
|
10月前
|
存储 Ubuntu Linux
安卓手机免root安装各种Linux系统:Ubuntu, Centos,Kali等
此外还可以安装Slackware、Archstrike等系统,还可以通过github查找方法安装更多有趣的东西。 昨日小编就是通过Termux安装的Kali Linux工具包。

热门文章

最新文章