概念
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
更多介绍,参考kettle中文网:http://www.kettle.net.cn/
2.kettle四大家族
Chef(中文:厨师)、Kitchen(中文:厨房)、Spoon(中文:勺子)、Pan(中文:平底锅)—注意英文发
Chef—工作(job)设计工具 (GUI方式)
Kitchen—工作(job)执行器 (命令行方式)
Spoon—转换(transform)设计工具 (GUI方式)
Span—转换(transform)执行器 (命令行方式)
安装与使用
官网地址:https://community.hitachivantara.com/docs/DOC-1009855
再到想要的版本进行下载,使用迅雷下载速度比较快,直接把下载的地址到迅雷就好了。
百度云下载地址里面有8.2的和7.1的
链接:https://pan.baidu.com/s/1jzNf90pq43O6qTmJ0EDoew
提取码:7ssq
下载完直接解压如下图,双击Spoon.bat就可以直接使用
连接数据库的话需要在lib目录下添加数据库驱动包,一个是mysql的,一个是oracle的,添加完后重启就可以连接数据库了。
- Spoon.bat: 图形界面方式启动作业和转换设计器。
- Pan.bat: 命令行方式执行转换。
- Kitchen.bat: 命令行方式执行作业。
- Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。
- Encr.bat: 密码加密
转换和作业:
Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。
•转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)。
•作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,转换也是一个作业项。