Kettle转换步骤(五)

简介: Kettle转换步骤(五)

转换步骤分类:

  • 增加新的列
  • 字符串处理
  • 行列变换
  • 排序/排重/字段选择

增加新的列

使用比较简单,直接填写新增的字段

20190505210356863.png计算器的使用

20190505212942158.png

字符串拆分

20190505215651119.png

字符串合并

20190505221229180.png字符串替换

值映射:对数值进行映射,例如经典的性别1 0映射为男 女:

20190505221326821.png


字符串其它转换

2019050522143962.png

字符串操作:

可以进行字符串转义(例如> 转义为 >)、保留/去除字符串里的数字、移除特殊字符、补充长度

行列变换

图示如下:(也叫正规化-列转行-宽表变窄表/ 反正规化-行转列-窄表变宽表)

20190505221751122.png

列转行

20190505222904845.png

20190505223107415.png

行转列

2019050522362834.png

排序/去重/字段选择

排序

20190505223854693 (1).png

排重

Unique Row: 需要事先排序:

Unique Row(Hash): 不排序,速度快,占内存。

相关文章
|
6月前
|
SQL
kettle开发篇-参数
kettle开发篇-参数
138 0
|
6月前
|
数据库连接 数据库
kettle开发篇-流查询
kettle开发篇-流查询
165 0
|
JavaScript 前端开发
kettle从sftp下载多个文件并进行转换后输出
kettle从sftp下载多个文件并进行转换后输出
|
1月前
|
Java
ETL工具 Kettle 中 kettle循环传递变量_(最简单的方法)
本文详细介绍了如何在Kettle工具中使用循环传递变量,通过示例展示了如何将movies表数据按月插入到ods_movies表,涉及新建转换、获取变量、作业配置和执行,呈现了一个嵌套作业结构.
87 3
|
22天前
|
数据采集 监控 数据可视化
Kettle的特点是什么?如何使用?
【10月更文挑战第24天】Kettle的特点是什么?如何使用?
50 2
|
6月前
|
存储 NoSQL MongoDB
MongoDB数据库转换为表格文件的Python实现
MongoDB数据库转换为表格文件的Python实现
219 0
|
5月前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之数据源同步时,使用脚本模式采集mysql数据到odps中,使用querySql方式采集数据,在脚本中删除了Reader中的column,但是datax还是报错OriginalConfPretreatmentUtil - 您的配置有误。如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
6月前
|
数据库
kettle开发篇-映射
kettle开发篇-映射
155 0
|
Java 网络安全
Kettle流程步骤与应用步骤(六)
Kettle流程步骤与应用步骤(六)
283 1
Kettle流程步骤与应用步骤(六)
|
SQL Oracle 关系型数据库
Kettle输出步骤(四)
Kettle输出步骤(四)
201 0
Kettle输出步骤(四)