kettle开发篇-记录关联(笛卡尔积)

简介: kettle开发篇-记录关联(笛卡尔积)

前言:


昨天我们讲了数据流相关操作,合并记录,通过合并记录,我们就可以用来比对两份新旧数据的变化情,并标记出记录是“identical”-旧数据和新数据一样、“changed”-数据发生了变化、“new”-新数据中有而旧数据中没有的记录、“deleted”-旧数据中有而新数据中没有的记录。四种状态,这个组件帮助了我们有效的去处理新旧数据被修改了但因数据量大很难一下找到数据修改变化的场景。


一、记录关联(笛卡尔积)


记录关联就是对两个数据流进行笛卡尔积操作。如下图所示,我们有两组数据分别为aaa和bbb,笛卡尔积后我们生成了4种结果,即2*2=4条记录。

记录关联(笛卡尔积)需要注意的是我们需要指定一个主步骤。即参考基准的数据。


二、任务实操


我们有这么一个需求就是从Excel读取两位和三位数,完成两位和三位数的组合(笛卡尔积),把结果保存到Excel.

针对这个任务,我们最终的转换由两个Excel输入、记录关联、EXcel输出组成。通过对Excel输入和Excel输入2进行笛卡尔积组合,然后将计算结果输出至Excel输出。

因前面多次讲到了Excel输入和输出,在这边就不再重复阐述了,重点阐述下记录关联(笛卡尔输出)。记录关联的重点需要关注的是以哪个为主步骤,根据需求来看我们随便选择一个即可,然后我们运行转换即可看到我们笛卡尔积的运算结果了。

相关文章
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
1490 0
|
数据库
kettle开发篇-记录集连接
kettle开发篇-记录集连接
618 0
|
调度
kettle开发篇-写日志
kettle开发篇-写日志
1471 0
|
数据库连接 数据库
kettle开发篇-数据库查询
kettle开发篇-数据库查询
780 0
|
数据采集 数据挖掘
kettle开发-数据清洗之字符串替换
kettle开发-数据清洗之字符串替换
947 2
|
XML 存储 网络协议
kettle开发篇-Http client
kettle开发篇-Http client
1593 0
|
Oracle 前端开发 关系型数据库
kettle开发篇-更新
kettle开发篇-更新
824 1
|
Java
ETL工具 Kettle 中 kettle循环传递变量_(最简单的方法)
本文详细介绍了如何在Kettle工具中使用循环传递变量,通过示例展示了如何将movies表数据按月插入到ods_movies表,涉及新建转换、获取变量、作业配置和执行,呈现了一个嵌套作业结构.
2825 3
|
IDE Java API
Kettle如何进行二次开发?
【10月更文挑战第24天】Kettle如何进行二次开发?
1161 0
|
SQL XML JSON
大数据ETL开发之图解Kettle工具(入门到精通)
ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可少。
8258 0
大数据ETL开发之图解Kettle工具(入门到精通)