kettle开发篇-拆分字段

简介: 笔记

前言:


前面我们有讲到合并字段,将firstname和lastname合并为姓名,今天我们来讲解怎么将一个字段拆分为多个字段,怎么将一列数据转换为多行。拆分字段的用处比如前面提到的获取firstname 和 lastname,也可用于从批次号中获取型号等。如约翰-詹姆斯,我们按照“-”进行拆分就得到我们想要的约翰、詹姆斯了。同样的在批次号WZ20221211_HZN502我们通过“_”拆分后就获得了我们需要的型号HZN502了。今天我们按照惯例还是以EXCEL为案例来演示具体执行过程。


一、拆分字段


1、拆分字段就是将一个字段拆分为多个字段,原字段就不存在数据流之中,拆分的规则是按照一个的分隔符进行拆分。具体语法如下图所示。

60.png

2、实操将EXCEL中name拆分为firstname 和 lastname,具体转换包括EXCEL输入、拆分字段、EXCEL输出。

62.png

EXCEL输入还是和以前一样,选择EXECL表,指定字段。


63.png

拆分字段,我们先选择要拆分的字段,然后选择拆分符为-,然后输入两个新字段的名称分别为firstname 和 lastname并指定对应字段类型为string类型。

64.png

EXCEL输出还是和以前一样,选择EXCEL输出的位置,点击运行转换,查看运行结果,如图所示我们看到我们将原来的name字段拆分为了firstname和lastname这两个新字段,功能还是非常强大的,但是我们需要注意的是原来字段就不存在数据流中,因此我们输出的EXCEL中就不存在原来name字段的值。

最后我们在我们的EXCEL表输出中,看到了我们需要的firstname 和 lastname两列的值。真的比较简单,快去试试吧。

image.pngimage.png


相关文章
|
5月前
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
205 0
|
分布式计算 数据处理 MaxCompute
MaxCompute单字段拆分多行多列
数据导入MaxCompute后,需要把某个字段String类型(多键值(key-value )对 ) 拆分成多行,每行有都有key, value两列。比如“{k1:v1,k2:v2,k3:k4}” 拆成多行,每行两个值key,value 分别为k1,v1;k2,v2;k3;k4。
3867 0
|
3月前
|
存储 SQL 缓存
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
|
3月前
|
Kubernetes 关系型数据库 MySQL
实时计算 Flink版操作报错合集之一张大表主键是多个字段组成的,按第一个主键的column划分出现了数据倾斜,该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
4月前
|
分布式计算 关系型数据库 数据挖掘
实时数仓 Hologres产品使用合集之如果采用组合主键,比如id + 时间时间(字符串),做为组合主键后是否会导致数据倾斜呢
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
5月前
|
存储 SQL 数据管理
平台设计-固定表结构与可自定义表结构
整个平台的表结构分为两种:固定的和可自定义的。
|
5月前
|
SQL Java 数据库
Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
【2月更文挑战第10天】Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
126 0
|
5月前
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
221 0
|
5月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
137 0
|
SQL 安全 关系型数据库
php开发实战分析(8):mysql类库的操作高级使用API开发(字段操作、权限分配、日期格式、跨表查询,数据分表)
php开发实战分析(8):mysql类库的操作高级使用API开发(字段操作、权限分配、日期格式、跨表查询,数据分表)
320 0
下一篇
无影云桌面