ETL工具之——kettle使用简介

简介:
今天我们打断一下ELK工具的使用讲解过程,来说说ETL工具kettle。首先我们要了解一下什么是ETL工具:
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

把数据从源取出,通过处理后放到标准的数据库中,你可以初略的这么去认为,这对于需要大量操作数据表格的人来说是有福了额(集团对账,片区分销体系汇总,无数的Excel),你可以在保证在数据格式安全合法的情况下UI试的吧元数据规规矩矩的导入到你的表里面,然后在进行相关的操作。ETL工具有很多,相关信息大家可以参考这篇文章:http://blog.csdn.net/hfxl1108/article/details/8564941 。而我今天要说的就是其中一款开源开源工具:kettle 下载地址:http://kettle.pentaho.com/

kettle ,是一款很好用的开源工具。期精准的UI操作非常的省事。我今天要说的是Windows版本,当然Windows版本和LIunx的操作是一样的。首先我们去下载好kettle,然后解压至指定目录。进入目录运行spoon.bat

image

出现UI界面:
image

最终界面:
image

你可以选择新建一个准换,然后在左侧的组件界面选择组件,拉去到右侧的空白面板上,我们今天一一个Excel数据到数据库为例子:需要选取三个组件,分别是:获取文件名、Excel输入、表输出
选取完成以后是这个样子的:
image

我们需要按照先后顺序对其进行连接:按住shift然后连接:
image

好了,现在开始我们的UI操作,
第一步:双击获取文件名

image

完成以后的设置应该是这个样子的:
image

至此第一步完成

第二步:双击Excel输入
1、编辑文件面板:

image

完成后的文件面板:
image

2、编辑工作表面板:这里需要注意的是,你要明确你的表头在在第几行第几列(从0开始)不然后面获取字段的时候会出现问题。
image
完成后的面板:
image
3、编辑字段面板:
image
至此Excel输入完成。

第三步:双击表输出
1、新建一个数据库练级:
image

2、选择目标表
image
3、获取数据字段:
image
4、映射字段:
image
打完收工。

第四步:获取文件名

image

第五步:运行
image
image
image

到这里就全部完成了,来看看数据是否进入了数据库:
image
数据已存在!

好了,你可以进行你操作了,还有很多很多的好用的功能没有介绍,自己去看看吧,很好玩的。

目录
相关文章
|
3月前
|
调度
kettle开发篇-写日志
kettle开发篇-写日志
88 0
|
3月前
kettle开发篇-空操作
kettle开发篇-空操作
31 0
|
9月前
|
数据采集 SQL 分布式计算
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
数据处理 、大数据、数据抽取 ETL 工具 DataX 、Kettle、Sqoop
989 0
|
6月前
|
数据采集 Java 关系型数据库
企业实战(20)ETL数据库迁移工具Kettle的安装配置详解
企业实战(20)ETL数据库迁移工具Kettle的安装配置详解
165 0
|
7月前
|
JSON 数据可视化 关系型数据库
Kettle可视化ETL工具快速入门 2
Kettle可视化ETL工具快速入门
149 0
|
7月前
|
JSON 数据可视化 关系型数据库
Kettle可视化ETL工具快速入门 1
Kettle可视化ETL工具快速入门
263 0
|
12月前
|
数据采集 缓存 分布式计算
大数据 ETL 处理工具 Kettle 的核心概念
上一篇中对 Kettle 进行了简单的介绍,并快速体验了一把 Kettle,完成了「把数据从 CSV 文件复制到 Excel 文件」 HelloWrold 级别的功能。 而在实际工作中,可以使用 Kettle 的图形化的方式定义复杂的 ETL 程序和工作流,如下图就是通过一系列的转换(Transformation) 完成一个作业(Job)流程。
|
分布式计算 Oracle 关系型数据库
异构数据源离线同步工具之DataX的安装部署
异构数据源离线同步工具之DataX的安装部署 🍅程序员小王的博客:程序员小王的博客 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 🍅 如有编辑错误联系作者,如果有比较好的文章欢迎分享给我,我会取其精华去其糟粕 🍅java自学的学习路线:java自学的学习路线 🍅该博客参考文献:阿里云DataX,DataX官网,尚硅谷大数据研究院 ———————————————— 版权声明:本文为CSDN博主「程序员小王java」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/weixin_44385486/a
860 0
异构数据源离线同步工具之DataX的安装部署
|
数据采集 Oracle 关系型数据库
Kettle入门(一)
Kettle入门(一)
361 0
Kettle入门(一)
|
数据采集 SQL 关系型数据库
Kettle工具使用及总结
kettle主要用于数据清洗,即常见ETL工具,拥有图形化界面且免费的优点。
407 0
Kettle工具使用及总结