kettle开发篇-列转行

简介: kettle开发篇-列转行

前言:


前面我们讲到了将一个字段拆分为多个字段,知道我们字段的横向分裂,从一个字段分为两个字段。学习了列拆分为多行,知道了怎么将一行的值拆分为多行,今天我们来学习一个列的高级操作,列传行,对于初学者来说,列传行也是一个比较高级的操作了,下面我们来看看列转行的语法和使用场景吧。


一、列转行


列转行就是如果数据一列有相同的值,按照指定的止损,把多行数据转换为一行数据。列转行以后会增加许多新的列,和拆分字段一样,原来被转换的列就会消失了。这就是列转行的原理。如下图所示,有七行数据分别代表张三周一至周日的工作小时,我们想实现的最终效果是,其中的星期被拆分为7列分别来存储工作小时。这样七行数据,最后就只剩下一行数据了。

需要注意的是列转行在转换前也需要进行排序操作,具体我们可以看到列转行主要包括关键字段即我们需要转换的字段,如星期,分组字段是我们相同的主字段,如姓名,目标字段是生成的字段名,数据字段是工作小时,即是目标字段的存储值。


二、任务


从EXCEL读取数据,按照姓名进行分组,把星期、工作小时从列转为行,并保存在EXCEL中。

最终我们的转换包括EXCEL输入、列转行、EXCEL输出。其中EXCEL输入和之前一样选择输入的EXCEL表格位置,并获取字段,重点阐述列转行,首先指定关键字段即我们需要转换的数据列,在我们的任务中就是星期字段,然后就是我们分组的字段即姓名,需要注意的是我们生成的新字段,根据数据来,数据中是周一至周日因此我们的列转行新字段名也分别是周一至周日。然后通过关键数据来查找。

需要注意的是我们做这个需求时,必须先排序字段值再进行列转行。好的,快去试试吧。

相关文章
|
6月前
|
数据采集 前端开发 数据挖掘
kettle开发-SQ索引优化
kettle开发-SQ索引优化
117 0
|
6月前
|
数据采集 数据挖掘
kettle开发-数据清洗之字符串替换
kettle开发-数据清洗之字符串替换
293 2
|
1月前
|
SQL 关系型数据库 Shell
SQL整库导出语录及其实用技巧与方法
在数据库管理和备份恢复过程中,整库导出是一项至关重要的任务
|
6月前
|
SQL 数据挖掘 HIVE
【Hive SQL 每日一题】在线课程学生行为数据分析
该数据分析师任务是分析在线学习平台的学生行为,以优化课程内容和学习体验。提供的数据包括`students`表(含学生ID、姓名、年龄和性别)和`course_activity`表(含活动ID、学生ID、课程ID、活动日期和学习时长)。分析涉及:1) 学生参加的课程数量,2) 课程总学习时长,3) 按性别分组的平均学习时长,4) 学生首次参加的课程及日期,5) 学生最近一次学习的时长,以及6) 参与学生最多的课程。所有查询都使用了SQL,部分涉及窗口函数和分组统计。数据集可在给定链接下载。
65 2
|
6月前
|
SQL HIVE 索引
Hive【Hive(五)函数-高级聚合函数、炸裂函数】
Hive【Hive(五)函数-高级聚合函数、炸裂函数】
|
6月前
|
SQL 数据挖掘 数据库
SQL数据分析实战:从导入到高级查询的完整指南
SQL数据分析实战:从导入到高级查询的完整指南
152 0
|
6月前
kettle开发篇-行转列
kettle开发篇-行转列
400 0
|
6月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
156 0
|
6月前
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
279 0
|
6月前
|
SQL 流计算
Flink SQL提供了行转列的功能,可以通过使用`UNPIVOT`操作来实现
【1月更文挑战第1天】Flink SQL提供了行转列的功能,可以通过使用`UNPIVOT`操作来实现
513 0