大家都知道,这2001年以来,一直在同各种ETL工具做斗争,所以Matt 确定了Kettle的一个主要设计目标是尽可能开放。主要就是指:
- 开发,可读的元数据格式(XML)。
- 开放,可读的关系型资源库格式。
- 开放的API。
- 容易安装(少于2分钟)
- 对各类数据库开放
- 容易使用的图形用户界面
- 容易传送数据
- 容易把数据转换成各种格式
另外,Matt他明白,ETL性能瓶颈应该主要在于数据的编码和解码。所以,Kettle的一个设计原则就是尽量不做数据的转换。
由于缺少各种关系数据库的驱动,所以,Matt最终还是采用了当时较新和较流行的java开发语言。
不多赘述,大家跟随我的这一系列博客学习下来,会有很大的体会和收获!
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6906914.html,如需转载请自行联系原作者