kettle里有不同工具,分别用于ETL的不同阶段。
初学者,建议送Spoon开始。高手,是四大工具都会用。
Sqoop: 图形界面工具,快速设计和维护复杂的ETL工作流。集成开发环境,提供了一个图形用户界面,用于创建/编辑作业和转换。Sqoon也额可以用于执行/调试作业或转换,它也有性能监控的功能。
Kitchen: 运行作业的命令行工具。作业的命令行运行程序,可以通过Shell脚本来使用。Shell脚本一般通过调度程序,如cron或Windows计划任务,来调度执行。
Pan : 运行转换的命令行工具,和Kitchen一样通过Shell脚本来使用。执行转换而不是作业。
Carte: 轻量级的(大概1MB)Web服务器,用来远程执行转换或作业。一个运行有Carte进程的机器可以作为从服务器,从服务器是kettle集群的一部分。
我这里是以Windows下安装kettle为例。
是安装在D:\SoftWare\kettle\data-integration下
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6907878.html,如需转载请自行联系原作者