无事来学学--Kettle中转换组件使用(上)

简介: 如果想具体看看转换的概念和特点可以点击之前的博客

1、转换是转换里面的第四个分类。


转换属于ETL的T,T就是Transform清洗、转换。ETL三个部分中,T花费时间最长,是一般情况下这部分工作量是整个ETL的2/3。


2、Concat fields


就是多个字段连接起来形成一个新的字段。

网络异常,图片无法展示
|
网络异常,图片无法展示
|


3、 值映射


把字段的一个值映射成其他的值。在数据质量规范上使用非常多,比如很多系统对应性别gender字段的定义不同。

网络异常,图片无法展示
|
网络异常,图片无法展示
|


4、增加常量


在本身的数据流里面添加一列数据,该列的数据都是相同的值。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


5、增加序列


给数据流添加一个序列字段。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


6、字段选择


从数据流中选择字段、改变名称、修改数据类型。

网络异常,图片无法展示
|
网络异常,图片无法展示
|


可以选择要移除的字段。

网络异常,图片无法展示
|
\

网络异常,图片无法展示
|


可以选择要改变的元数据信息。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


7、计算器


一个函数集合来创建新的字段,还可以设置字段是否移除(临时字段)。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


8、剪切字符串


指定输入流字段裁剪的位置剪切出新的字段。

网络异常,图片无法展示
|
网络异常,图片无法展示
|


9、字符串替换


指定搜索内容和替换内容,如果输入流的字段匹配上搜索内容就进行替换生成新字段。

网络异常,图片无法展示
|

网络异常,图片无法展示
|

目录
相关文章
|
传感器 数据采集 物联网
STM32:高性能微控制器与广泛的应用领域
STM32:高性能微控制器与广泛的应用领域
824 0
|
XML Java 数据格式
使用Freemarker模版导出xls文件使用excel打开提示文件损坏
使用Freemarker模版导出xls文件使用excel打开提示文件损坏
301 0
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
629 0
|
12月前
|
消息中间件 前端开发 安全
简化部署流程:Rainbond让Jeepay支付系统部署更轻松
在如今的开发环境中,部署一套像 Jeepay 这样的 Java 支付系统往往需要开发者面对繁琐的配置、依赖环境管理以及服务的高可用性保障,手动部署和运维变得异常艰巨和费时。然而,借助 Rainbond 这样的云原生 PaaS 平台,这一过程变得前所未有的简单。通过 Rainbond 的“点点点”式应用管理和自动化运维功能,开发者可以轻松完成 Jeepay 系统的部署,极大减少了传统的部署难度和复杂性,让你更专注于业务的快速迭代和创新。 本文将详细介绍如何通过 Rainbond 平台一步步部署 Jeepay 系统,无需复杂的配置,只需简单操作即可完成,帮助开发者快速构建一个稳定、安全的支付系统
简化部署流程:Rainbond让Jeepay支付系统部署更轻松
|
SQL 前端开发 JavaScript
kettle开发-超好用自定义数据处理组件
kettle开发-超好用自定义数据处理组件
496 0
|
Linux 网络安全
Linux(16)ssh_exchange_identification: read: Connection reset by peer问题
Linux(16)ssh_exchange_identification: read: Connection reset by peer问题
220 0
|
12月前
|
算法 安全 前端开发
基于postMessage和BroadcastChannel实现浏览器跨Tab窗口通信的方法介绍
基于postMessage和BroadcastChannel实现浏览器跨Tab窗口通信的方法介绍
366 0
|
机器学习/深度学习 自动驾驶 算法
Skeleton Recall Loss 分割领域的新突破:极大的减少了资源消耗,还能提高性能
这篇论文则介绍了一个新的损失:Skeleton Recall Loss,我把它翻译成骨架召回损失.这个损失目前获得了最先进的整体性能,并且通过取代密集的计算**他的计算开销减少超过90% !**
178 1
Skeleton Recall Loss 分割领域的新突破:极大的减少了资源消耗,还能提高性能
|
12月前
|
SQL 关系型数据库 MySQL
ETL工具 Kettle 中怎么通过变量传参
ETL工具 Kettle 中怎么通过变量传参
887 0
|
Web App开发 前端开发 测试技术
【如何学习Python自动化测试】—— 页面元素定位
【如何学习Python自动化测试】—— 页面元素定位
450 1