无事来学学--Kettle中转换组件使用(下)

简介: 如果想具体看看转换的概念和特点可以点击之前的博客

10、字符串操作


去除字符串两端的空格和大小写切换,并生成新的字段。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


11、去除重复记录


去除数据流里面相同的数据行。注意:必须先对数据流进行排序!

网络异常,图片无法展示
|
\

网络异常,图片无法展示
|


12、排序记录


按照指定的字段的升序或降序对数据流排序。

网络异常,图片无法展示
|
网络异常,图片无法展示
|


13、唯一行(哈希值)就是删除数据流重复的行。


注意:唯一行(哈希值)和(排序记录+去除重复记录)效果一样的,但是实现的原理不同!

网络异常,图片无法展示
|
\

唯一行(哈希值)执行的效率会高一些!唯一行哈希值是根据哈希值进行比较的,而去除重复记录是比较相邻两行数据是否一致进行比较的。

网络异常,图片无法展示
|


14、拆分字段


把字段按照分隔符拆分成两个或多个字段 注意:拆分字段后,原字段就不存在于数据流中!

网络异常,图片无法展示
|

网络异常,图片无法展示
|


15、列拆分为多行


把指定分隔符的字段进行拆分为多行。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


16、列转行


如果数据一列有相同的值,按照指定的字段,把多行数据转换为一行数据。去除一些原来的列名,把一列数据变为字段。

网络异常,图片无法展示
|
\

注意:列转行之前数据流必须进行排序!必须使用排序记录图元哦!

网络异常,图片无法展示
|


17、行转列


把数据字段的字段名转换为一列,把数据行变为数据列。

网络异常,图片无法展示
|

网络异常,图片无法展示
|


18、行扁平化


把同一组的多行数据合并成为一行。注意:只有数据流的同类数据数据行记录一致的情况才可使用!数据流必须进行排序,否则结果会不正确!

目录
相关文章
|
4月前
|
数据库 对象存储
2025年 | 6月云大使推广奖励规则
云大使618活动上线。推荐首购达标,激励层层加码;月度消费达标,冲刺赢惊喜。最高可获得9万奖励;
|
Java jvm-sandbox Perl
Jvm-Sandbox源码分析--启动简析
1.工作原因,使用jvm-sandbox比较多,遂进行源码分析,做到知己知彼,个人能力有限,如有错误,欢迎指正。 2.关于jvm-sandbox 是什么,如何安装相关环境,可移步官方文档 3.源码分析基于jvm-sandbox 最新的master代码,tag-1.2.1。
8311 1
Jvm-Sandbox源码分析--启动简析
|
7月前
|
人工智能 安全 大数据
【限时特惠】阿里云服务器7折抢购!高性能+高性价比,开发者与企业必备攻略
阿里云服务器限时7折特惠,高性能、高性价比,为开发者和企业量身打造!新老用户均可参与,灵活配置满足多种需求,全球节点低延迟覆盖。自研神龙架构保障稳定性,安全防护全面,操作便捷,生态丰富。适用于个人开发、企业部署、跨境业务及AI计算等场景。点击专属链接立即抢购,活动名额有限,速来享受云端算力带来的高效体验!
142 0
|
11月前
|
运维 监控 安全
深入理解微服务架构:设计原则、挑战与实践
深入理解微服务架构:设计原则、挑战与实践
|
12月前
|
数据采集 存储 监控
如何使用 Python 爬取商品数据
如何使用 Python 爬取京东商品数据
266 3
|
Oracle 关系型数据库 数据库
Oracle数据库协议适配器错误解决方法
Oracle数据库协议适配器错误解决方法
992 2
|
JavaScript 前端开发 Java
驼峰命名规范及其在代码可读性中的重要性
驼峰命名规范及其在代码可读性中的重要性
540 15
|
机器学习/深度学习 存储 缓存
BurstAttention:可对非常长的序列进行高效的分布式注意力计算
研究人员探索了提高LLM注意力机制效率的策略,包括FlashAttention(利用SRAM加速)和RingAttention(分布式多设备处理)。新提出的BurstAttention结合两者,优化跨设备计算与通信,减少40%通信开销,使128K长度序列在8×A100 GPU上的训练速度翻倍。论文于3月发布,但实现未公开
221 3
|
存储 安全 网络安全
Windows操作系统中:共享文件夹以及防火墙介绍
Windows操作系统中:共享文件夹以及防火墙介绍
1045 0
|
关系型数据库 分布式数据库 数据库
【PolarDB开源】PolarDB开源社区指南:如何参与贡献及获取技术支持
【5月更文挑战第21天】阿里云开源PolarDB云原生数据库,邀请全球开发者参与贡献和技术支持。PolarDB开源社区提供交流平台,包括技术动态、文档编写和代码贡献。参与者需注册账号,了解项目,提交符合规范的Pull Request,并参与代码审查和讨论。获取技术支持可通过官方文档、技术讨论和问题报告。示例代码展示了连接PolarDB数据库执行查询的基本操作。加入社区,共同推动PolarDB发展!
250 4