kettle资源库介绍

简介: kettle资源库

1,kettle资源库

(1)数据库资源库:

数据库资源库可以把所有的ETL信息都保存在关系型数据库中,这种资源库比较容易创建,只要新建一个数据库连接即可,可以使用数据库资源库对话框来创建资源库中的表和索引。

(2)文件资源库:

文件资源库是在一个文件目录下定义一个资源库,因为kettle使用的是虚拟文件系统,,所以这里的文件目录是一个广泛的概念,包括Zip文件,web服务,ftp服务等。

(3)Pentaho资源库:

Pentaho资源库是一个插件,在kettle企业版中有这个插件,这种资源库实际是一个内容管理系统(CMS),具备一个理想的资源库的所有特性,包括版本控制和依赖完整性检查。

注意:kettle7.1版本创建资源库的时候,打开默认是Pentaho资源库,点击other repositories,可以创建数据库资源库与文件资源库。个人认为数据库资源库安全性更高,但是操作性一般;文件资源便于操作,但是权限把控,应该作为重点关注点

2,kettle资源库特性

(1)中央存储:在一个中心位置存储所有的转换和作业。ETL用户可以访问到工程的最新视图。

(2)文件加锁:防止多个用户同时操作。

(3)修订管理:一个理想的资源库可以存储一个转换或者作业的所有历史版本,以便将来参考,可以打开历史版本,并查看变更日志。

(4)依赖完整性检查:检查资源库转换和作业之间的相互依赖关系,可以确保资源库里面没有丢失任何的链接,没有丢失任何转换、作业和数据库连接。

(5)安全性:可以防止未授权的用户修改和执行ETL作业。

(6)引用:重新组织转换、作业、或者重新命名,都是ETL开发人员常见工作,要做好这些工作,需要完整的转换和作业的引用。

相关文章
|
存储 编解码 缓存
webgl系列之抗锯齿和深度缓存
前言 大家好我是Fly 哥, 这是今年webgl 系列的第三篇文章, 如果你之前的两篇文章没看的话,建议先看一下,然后再来看这一篇文章 Webgl 系列之buffer的使用 webgl系列之对光栅化的理解 上一篇文章,任何虚拟3维世界的转换到二维屏幕中通过「采样」 也就判断屏幕上的每个像素中心点是不是在三角形内部的得到了 下面这幅图: 图片 走样之前 这时候有同学问, 这不像三角形哇, 这个其实用个专业的词—— 「锯齿」 , 我的理解 一个三角形经过光栅化后, 得到屏幕上每一个像素点 组成的像素点的集合。那到底是经过什么样的处理得到下面这张图: 图片 final 反走样 其实出现上面
webgl系列之抗锯齿和深度缓存
|
2月前
|
传感器 人工智能 自然语言处理
魔搭社区模型速递(7.26-8.2)
🙋魔搭ModelScope本期社区进展:1498个模型,130个数据集,85个创新应用, 7 篇内容
360 0
|
存储 自然语言处理 PyTorch
Transformers 4.37 中文文档(二十一)(1)
Transformers 4.37 中文文档(二十一)
170 0
|
SQL 缓存 安全
深入解析MyBatis-Plus LambdaQueryWrapper与QueryWrapper:高效数据查询的秘密
深入解析MyBatis-Plus LambdaQueryWrapper与QueryWrapper:高效数据查询的秘密
13058 2
|
监控 Java 数据库连接
解决Spring Boot中的数据库连接池问题
解决Spring Boot中的数据库连接池问题
|
XML Java API
Kettle资源库运行方式(二)
Kettle资源库运行方式(二)
708 0
Kettle资源库运行方式(二)
|
存储 JavaScript Ubuntu
Linux终端记录神器
Linux终端记录神器
118 0
|
SQL Java 数据库连接
Could not open client transport with JDBC Uri: jdbc:hive2://192.168.88.10:10000: java.net.ConnectExc
Could not open client transport with JDBC Uri: jdbc:hive2://192.168.88.10:10000: java.net.ConnectExc
663 0
|
存储 SQL JSON
5、DataX(DataX简介、DataX架构原理、DataX部署、使用、同步MySQL数据到HDFS、同步HDFS数据到MySQL)(一)
5、DataX(DataX简介、DataX架构原理、DataX部署、使用、同步MySQL数据到HDFS、同步HDFS数据到MySQL)(一)