sqoop的导入导出以及where条件过滤数据导出

2023-02-03 571

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介： sqoop的导入导出以及where条件过滤数据导出

一、sqoop的导入

sqoop可以实现传统数据库到hive数据的导入操作
关键字：import

sqoop import  
#指定JDBC的URL 其中database指的是(Mysql或者Oracle)中的数据库名
 --connect jdbc:mysql://ip:3306/databasename  
#要读取数据库database中的表名
 --table  tablename   
#用户名 
 --username root
#密码 
 --password  123456    
#指的是HDFS中导入表的存放目录(注意：是目录)
 --target-dir  /path  
#设定导入数据后每个字段的分隔符，默认；分隔
 --fields-terminated-by '\t'  
#设定导入数据后每行的分隔符
 --lines-terminated-by '\n'  
#并发的map数量1,如果不设置默认启动4个map task执行数据导入，则需要指定一个列来作为划分map task任务的依据
 --m 1  
#增量导入
 --incremental  append 
#指定增量导入时的参考列 
 --check-column：column_id 
#上一次导入column_id的最后一个值
 --last-value：num  
#导入的字段为空时，用指定的字符进行替换
 --null-string ''

二、sqoop的导出

sqoop导出hive的数据到mysql、oracle等
关键字：export

 sqoop export
#指定JDBC的URL 其中database指的是(Mysql或者Oracle)中的数据库名
 --connect jdbs:mysql://ip:3600/库名 
#数据库的用户名
 --username用户名  
#数据库的密码
 --password密码  
#需要导入到数据库中的表名 
 --table表名     
#hdfs上的数据文件
 --export-dir导入数据的名称   
#HDFS中被导出的文件字段之间的分隔符
 --fields-terminated-by ‘\t’    
#设定导入数据后每行的分隔符
 --lines-terminated-by '\n'  
#并发的map数量1,如果不设置默认启动4个map task执行数据导入，则需要指定一个列来作为划分map task任务的依据
 --m 1 
#增量导入 
 --incremental  append  
#指定增量导入时的参考列
 --check-column：column_id  
#上一次导入column_id的最后一个值
 --last-value：num  
#导出的字段为空时，用指定的字符进行替换
 --null-string ''

三、带where条件，过滤部分数据导出

用query参数，指定sql语句查询结果数据导出
格式：

sqoop export
--query 'select * from table where 1=1 and $CONTITONS'

注意：

$CONTITONS是linux系统的变量，query必须包含$CONDITIONS。

相关实践学习

如何在云端创建MySQL数据库

开始实验后，系统会自动创建一台自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS。

全面了解阿里云能为你做什么

阿里云在全球各地部署高效节能的绿色数据中心，利用清洁计算为万物互联的新世界提供源源不断的能源动力，目前开服的区域包括中国（华北、华东、华南、香港）、新加坡、美国（美东、美西）、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程，来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品：云服务器ECS 云服务器 ECS（Elastic Compute Service）是一种弹性可伸缩的计算服务，助您降低 IT 成本，提升运维效率，使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs

sqoop的导入导出以及where条件过滤数据导出

一、sqoop的导入

二、sqoop的导出

三、带where条件，过滤部分数据导出

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

sqoop的导入导出以及where条件过滤数据导出

一、sqoop的导入

二、sqoop的导出

三、带where条件，过滤部分数据导出

热门文章

最新文章

相关课程

相关电子书

相关实验场景