软件介绍 | 学习笔记

本文涉及的产品
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介: 快速学习 软件介绍

开发者学堂课程【Sqoop 企业级大数据迁移方案实战软件介绍学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/718/detail/12832


软件介绍


内容介绍:

一、Apache sqoop 介绍

二、底层工作机制展现

三、知识点总结与补充


一、Apache sqoop 介绍

Apache sqoop 在大数据的出现通常是为了满足我们在两个体系中的数据流入,流出,一个体系叫做 Hadoop 生态体系比如说:HBMS、hive 数据仓库、hfds 这样纯数据的体系。另外一个 RDBMS 体系代表着关系型数据库:比如说Mysql,在企业当中支持我们的业务纯熟的数据

当需要在两个数据集之间做导入导出时该如何完成?

首先选择可以人为的去做,但是没有有工具时操作便利。所以 Apache sqoop 的目的便是作为工具出现。

作为在大数据中满足我们在两个体系中的数据流入,流出的工具。

如下图

image.png

左侧代表关系型数据库 RDBMS 体系,另外一边为 Hadoop file 生态系统 HDFS hive,这两个体系之间涉及到数据的流转即可用 Apache sqoop 完成。

此时便涉及到一个问题导入导出是一个相对的过程,那从哪里到哪里叫做导入,从哪里到哪里叫做导出呢?

可观察上图,从左边关系型数据库 DBMS 体系到 import

此时有一个小技巧 Apache sqoop 属于 Apache 配置,而 Hadoop file 生态系统大多数软件也属于 Apache 配置,因此可以站在 Apache 官方立场来看,数据导入我方。叫做导入,反之,数据从我方出去叫做导出。

那么在这两个体系之间进行数据的导入导出,在底层则是借助的 mapredure 程序完成的,也就是说当去敲一个Hadoop 的命令,编辑好所需完成的工作,此时 Hadoop 底层会转变为 mapredure 程序,此时可以做数据的输入,在做数据的输出,此时正好符合数据导入导出的过程,只不过在进行导入导出所采用的 mapredure 程序与平时所采用的程序已经发生了改变,这是所使用的 mapredure 程序在默认情况下,使用 text。

此时当他读数据库时无论是读或者写去使用 text 则无法满足需要使用 inputfrom 和 outputfrom 进行定制来满足关系型数据库的对接。

因此可将图复制出来,进行数据的描述,


二、底层工作机制展现

首先明确数据在左边体系为关系型数据库,最重要的概念为支持事务,面向事务,而在在右边的体系为 hadoop 生态体系,不管是 HDFS 还是 HBase 最终均依赖该系统,在两体系之间,如果数据来到 Apache sqoop 当中,此过程叫做数据的导入,当他进行数据导入,底层通过 mapredure 程序完成,在左侧读取时,则进行分类,叫做DBinputformat ,从命名可看出 DB 表明可进行读取数据库中的表,在输出时,默认 text out putFprmat。此时完成了数据的导入导出,

此时数据如果呈相反的过程,数据的导出,依然底层通过 mapredure 程序完成,此时因为导出需要独自编写数据,因此需要 TextInputFormat,所以读数据时变成了文本形式,此时向外写数据时叫做 DBoutputFormat,此为 sqoop 底层工作机制

image.png


三、知识点总结与补充

因此在完成 sqoop 数据导入导出时前提是保证  mapredure 程序开发环境可以正常运行,则可保证导入导出的正常运行。

sqoop 全程为 sql hadoop hadoop SQL

Apache sqoop 提供的一款很好的辅助软件,当涉及到在两个体系中的数据流入,流出时可借助 sqoop

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
6月前
|
安全 搜索推荐
坚持不懈,每天分享5款好用的软件
每个人的电脑中都会安装很多软件,可能还保留着很多不为人知的冷门软件。不过虽然冷门,但绝不意味着低能,相反很多冷门软件的功能十分出色。闲话少说,接下来我就给大家推荐5款冷门小工具,看一看有没有你喜欢的。
65 0
|
运维 架构师 测试技术
如何开发一个软件
软件开发
140 0
|
2月前
|
Ubuntu Linux 虚拟化
不错的软件和工具
不错的软件和工具
|
3月前
|
搜索推荐 数据管理 Windows
分享5款日常中非常好用的软件
本文精选五款高效能软件,旨在优化您的计算机使用体验。包括媒体中心Kodi,支持多媒体文件管理和播放;系统优化工具Winaero Tweaker,个性化Windows系统设置;微信空号检测软件燃精灵,快速筛选有效微信用户;磁盘管理利器DiskGenius,提供全面的数据管理和恢复服务;以及万能文件查看器FileViewPro,轻松预览多种文件格式。这些软件将帮助您提高工作效率,丰富娱乐生活,同时增强系统的稳定性和个性化。
37 0
|
6月前
|
安全 数据安全/隐私保护
回顾5款我非常喜欢的软件,希望大家也能喜欢
我喜欢分享好软件,这就像与老友聊天一样让我感到快乐。在这个过程中,我可以回顾这些实用的小工具,也希望它们可以帮助到更多人。
41 0
|
数据可视化 定位技术 数据安全/隐私保护
回顾5款实用小软件,希望大家能够喜欢
我喜欢分享好软件,这就像与老友聊天一样让我感到快乐。在这个过程中,我可以回顾这些实用的小工具,也希望它们可以帮助到更多人。
117 0
|
6月前
|
分布式计算 关系型数据库 MySQL
实战:在Linux上部署各类软件
实战:在Linux上部署各类软件
|
6月前
|
Web App开发 Windows
分享5款简单实用的软件,值得收藏
电脑上的各类软件有很多,除了那些常见的大众化软件,还有很多不为人知的小众软件,专注于实用功能,简洁干净、功能强悍。
82 0
|
存储 人工智能 文字识别
Goodnotes替代品!有哪些类似Goodnotes的笔记软件?
Goodnotes 6从买断制变更为订阅制,不少用户感觉遭到”背刺“,如果你也正在寻找类似Goodnotes的笔记软件,那今天的这篇文章,就非常适合你~
Goodnotes替代品!有哪些类似Goodnotes的笔记软件?
|
Web App开发 安全 Linux
我分享的这5款好用的软件,你都用过吗?
我经常在网上寻找一些好用的软件,并尝试使用它们,最后把我的心得和感受分享给大家。
105 0