kettle资源库介绍

简介: kettle资源库

1,kettle资源库

(1)数据库资源库:

数据库资源库可以把所有的ETL信息都保存在关系型数据库中,这种资源库比较容易创建,只要新建一个数据库连接即可,可以使用数据库资源库对话框来创建资源库中的表和索引。

(2)文件资源库:

文件资源库是在一个文件目录下定义一个资源库,因为kettle使用的是虚拟文件系统,,所以这里的文件目录是一个广泛的概念,包括Zip文件,web服务,ftp服务等。

(3)Pentaho资源库:

Pentaho资源库是一个插件,在kettle企业版中有这个插件,这种资源库实际是一个内容管理系统(CMS),具备一个理想的资源库的所有特性,包括版本控制和依赖完整性检查。

注意:kettle7.1版本创建资源库的时候,打开默认是Pentaho资源库,点击other repositories,可以创建数据库资源库与文件资源库。个人认为数据库资源库安全性更高,但是操作性一般;文件资源便于操作,但是权限把控,应该作为重点关注点

2,kettle资源库特性

(1)中央存储:在一个中心位置存储所有的转换和作业。ETL用户可以访问到工程的最新视图。

(2)文件加锁:防止多个用户同时操作。

(3)修订管理:一个理想的资源库可以存储一个转换或者作业的所有历史版本,以便将来参考,可以打开历史版本,并查看变更日志。

(4)依赖完整性检查:检查资源库转换和作业之间的相互依赖关系,可以确保资源库里面没有丢失任何的链接,没有丢失任何转换、作业和数据库连接。

(5)安全性:可以防止未授权的用户修改和执行ETL作业。

(6)引用:重新组织转换、作业、或者重新命名,都是ETL开发人员常见工作,要做好这些工作,需要完整的转换和作业的引用。

相关文章
|
19天前
kettle开发篇-空操作
kettle开发篇-空操作
42 0
|
19天前
|
调度
kettle开发篇-写日志
kettle开发篇-写日志
114 0
|
19天前
|
Oracle 前端开发 关系型数据库
kettle开发篇-更新
kettle开发篇-更新
100 1
|
12月前
|
存储 Linux 数据库
kettle常用指令
kettle常用指令
134 0
|
XML Java API
Kettle资源库运行方式(二)
Kettle资源库运行方式(二)
487 0
Kettle资源库运行方式(二)
|
数据采集 SQL 关系型数据库
Kettle工具使用及总结
kettle主要用于数据清洗,即常见ETL工具,拥有图形化界面且免费的优点。
418 0
Kettle工具使用及总结
|
数据采集 Java Linux
kettle工具(一):简单介绍-入门
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、 Unix.上运行,绿色无需安装,数据抽取高效稳定。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
1333 0
kettle工具(一):简单介绍-入门
资源库
学习 学术网站大全,详细介绍见:一个目前最全最实用的学习性网站导航 看国外 下载 下载神器:Free Download Manager 从此,下载百度文库文档变得简单 搜索 anywhereanything,详细介绍见:可以堪称资源神器的网站 游戏与开发、学习 Egret...
2033 0
|
关系型数据库 Java 数据库
|
数据库 数据格式 Java