kettle开发篇-拆分字段

简介: 笔记

前言:


前面我们有讲到合并字段,将firstname和lastname合并为姓名,今天我们来讲解怎么将一个字段拆分为多个字段,怎么将一列数据转换为多行。拆分字段的用处比如前面提到的获取firstname 和 lastname,也可用于从批次号中获取型号等。如约翰-詹姆斯,我们按照“-”进行拆分就得到我们想要的约翰、詹姆斯了。同样的在批次号WZ20221211_HZN502我们通过“_”拆分后就获得了我们需要的型号HZN502了。今天我们按照惯例还是以EXCEL为案例来演示具体执行过程。


一、拆分字段


1、拆分字段就是将一个字段拆分为多个字段,原字段就不存在数据流之中,拆分的规则是按照一个的分隔符进行拆分。具体语法如下图所示。

60.png

2、实操将EXCEL中name拆分为firstname 和 lastname,具体转换包括EXCEL输入、拆分字段、EXCEL输出。

62.png

EXCEL输入还是和以前一样,选择EXECL表,指定字段。


63.png

拆分字段,我们先选择要拆分的字段,然后选择拆分符为-,然后输入两个新字段的名称分别为firstname 和 lastname并指定对应字段类型为string类型。

64.png

EXCEL输出还是和以前一样,选择EXCEL输出的位置,点击运行转换,查看运行结果,如图所示我们看到我们将原来的name字段拆分为了firstname和lastname这两个新字段,功能还是非常强大的,但是我们需要注意的是原来字段就不存在数据流中,因此我们输出的EXCEL中就不存在原来name字段的值。

最后我们在我们的EXCEL表输出中,看到了我们需要的firstname 和 lastname两列的值。真的比较简单,快去试试吧。

image.pngimage.png


相关文章
|
6月前
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
225 0
|
12月前
|
PHP 数据库
fastadmin框架如何查询数据表指定时间段内的数据
fastadmin框架如何查询数据表指定时间段内的数据
412 0
|
3月前
|
SQL 分布式计算 关系型数据库
实时数仓 Hologres操作报错合集之指定主键更新模式报错主键数据重复,该如何处理
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
4月前
|
存储 SQL 缓存
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
|
5月前
|
分布式计算 关系型数据库 数据挖掘
实时数仓 Hologres产品使用合集之如果采用组合主键,比如id + 时间时间(字符串),做为组合主键后是否会导致数据倾斜呢
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
6月前
|
存储 SQL 数据管理
平台设计-固定表结构与可自定义表结构
整个平台的表结构分为两种:固定的和可自定义的。
|
6月前
|
SQL Java 数据库
Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
【2月更文挑战第10天】Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
212 0
|
6月前
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
260 0
|
6月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
150 0
|
应用服务中间件 Linux 索引
42分布式电商项目 - 修改索引库名称
42分布式电商项目 - 修改索引库名称
61 0