1、转换是转换里面的第四个分类。
转换属于ETL的T,T就是Transform清洗、转换。ETL三个部分中,T花费时间最长,是一般情况下这部分工作量是整个ETL的2/3。
2、Concat fields
就是多个字段连接起来形成一个新的字段。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
3、 值映射
把字段的一个值映射成其他的值。在数据质量规范上使用非常多,比如很多系统对应性别gender字段的定义不同。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
4、增加常量
在本身的数据流里面添加一列数据,该列的数据都是相同的值。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
5、增加序列
给数据流添加一个序列字段。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
6、字段选择
从数据流中选择字段、改变名称、修改数据类型。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
可以选择要移除的字段。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
可以选择要改变的元数据信息。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
7、计算器
一个函数集合来创建新的字段,还可以设置字段是否移除(临时字段)。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
8、剪切字符串
指定输入流字段裁剪的位置剪切出新的字段。
网络异常,图片无法展示
|
网络异常,图片无法展示
|
9、字符串替换
指定搜索内容和替换内容,如果输入流的字段匹配上搜索内容就进行替换生成新字段。
网络异常,图片无法展示
|
网络异常,图片无法展示
|