kettle开发篇-拆分字段

简介: 笔记

前言:


前面我们有讲到合并字段,将firstname和lastname合并为姓名,今天我们来讲解怎么将一个字段拆分为多个字段,怎么将一列数据转换为多行。拆分字段的用处比如前面提到的获取firstname 和 lastname,也可用于从批次号中获取型号等。如约翰-詹姆斯,我们按照“-”进行拆分就得到我们想要的约翰、詹姆斯了。同样的在批次号WZ20221211_HZN502我们通过“_”拆分后就获得了我们需要的型号HZN502了。今天我们按照惯例还是以EXCEL为案例来演示具体执行过程。


一、拆分字段


1、拆分字段就是将一个字段拆分为多个字段,原字段就不存在数据流之中,拆分的规则是按照一个的分隔符进行拆分。具体语法如下图所示。

60.png

2、实操将EXCEL中name拆分为firstname 和 lastname,具体转换包括EXCEL输入、拆分字段、EXCEL输出。

62.png

EXCEL输入还是和以前一样,选择EXECL表,指定字段。


63.png

拆分字段,我们先选择要拆分的字段,然后选择拆分符为-,然后输入两个新字段的名称分别为firstname 和 lastname并指定对应字段类型为string类型。

64.png

EXCEL输出还是和以前一样,选择EXCEL输出的位置,点击运行转换,查看运行结果,如图所示我们看到我们将原来的name字段拆分为了firstname和lastname这两个新字段,功能还是非常强大的,但是我们需要注意的是原来字段就不存在数据流中,因此我们输出的EXCEL中就不存在原来name字段的值。

最后我们在我们的EXCEL表输出中,看到了我们需要的firstname 和 lastname两列的值。真的比较简单,快去试试吧。

image.pngimage.png


相关文章
|
canal 关系型数据库 MySQL
es添加索引命令行和浏览器添加索引--图文详解
es添加索引命令行和浏览器添加索引--图文详解
405 1
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
665 0
kettle开发篇-空操作
kettle开发篇-空操作
267 0
|
数据采集 数据挖掘
kettle开发-数据清洗之字符串替换
kettle开发-数据清洗之字符串替换
602 2
|
JSON 算法 安全
不破不立!Fastjson2.0 性能炸裂,为了下一个十年
Alibaba Fastjson: 目前在人类已知范围内,这个星球跑的最快的Java JSON库。在过去的十年里,fastjson v1作为国内github star最多和最受欢迎的json解析库,如今fastjson v2 重磅来袭,性能炸裂。
18630 2
不破不立!Fastjson2.0 性能炸裂,为了下一个十年
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
528 0
|
机器学习/深度学习 自然语言处理 搜索推荐
预训练的词嵌入(Word Embedding)
预训练的词嵌入(Word Embedding)
|
12月前
|
SQL 关系型数据库 MySQL
ETL工具 Kettle 中怎么通过变量传参
ETL工具 Kettle 中怎么通过变量传参
946 0
kettle开发篇-记录关联(笛卡尔积)
kettle开发篇-记录关联(笛卡尔积)
491 0
|
存储 API 流计算
Flink DataStream API-概念、模式、作业流程和程序
前几篇介绍了Flink的入门、架构原理、安装等,相信你对Flink已经了解入门。接下来开始介绍Flink DataStream API内容,先介绍DataStream API基本概念和使用,然后介绍核心概念,最后再介绍经典案例和代码实现。本篇内容:Flink DataStream API的概念、模式、作业流程和程序。
Flink DataStream API-概念、模式、作业流程和程序