无事来学学--Kettle中应用,统计,映射组件的使用

简介: 应用组件转换里面的第五个分类。应用都是一些工具类。

替换NULL值

把null转换为其它的值。NULL值不好进行数据分析

操作实例:

网络异常,图片无法展示
|
网络异常,图片无法展示
|


写日志

主要是在调试的时候使用,把日志信息打印到日志窗口。\

网络异常,图片无法展示
|


统计组件


统计是转换里面的第十三个分类。统计是提供数据的采样和统计功能。

 

分组是按照某一个或某几个进行分组,同时可以将其余字段按照某种规则进行合并。

注意:分组之前数据应该进行排序!

操作实例:

网络异常,图片无法展示
|


映射组件

映射是转换里面的第十八个分类。映射是用来定义子转换,便于封装和重用。

映射(子转换)

用来配置子转换,对子转换进行调用的一个步骤。子转换可以让相同的业务功能进行重用,抽取出来,方便进行调用。

操作实例:

网络异常,图片无法展示
|
网络异常,图片无法展示
|


映射输入规范

是输入字段,由调用的转换输入。

操作实例:

网络异常,图片无法展示
|
网络异常,图片无法展示
|


映射输出规范

向调用的转换输出所有列,不做任何处理。

操作实例:

网络异常,图片无法展示
|


目录
相关文章
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
565 0
|
XML Java 数据格式
使用Freemarker模版导出xls文件使用excel打开提示文件损坏
使用Freemarker模版导出xls文件使用excel打开提示文件损坏
288 0
|
10月前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
533 3
|
12月前
|
消息中间件 运维 安全
云消息队列 ApsaraMQ Serverless 演进:高弹性低成本、更稳定更安全、智能化免运维
在 2024 年云栖大会上,阿里云智能集团产品专家刘尧全面介绍了云消息队列 ApsaraMQ Serverless 的落地成果和产品进展。此外,我们还邀请到杭州优行科技有限公司中间件消息研发负责人王智洋,分享了 ApsaraMQ for Kafka Serverless 助力曹操出行实现成本优化和效率提升的实践经验。
441 105
|
11月前
|
SQL 关系型数据库 MySQL
Go语言项目高效对接SQL数据库:实践技巧与方法
在Go语言项目中,与SQL数据库进行对接是一项基础且重要的任务
220 11
|
关系型数据库 数据库 数据安全/隐私保护
在 Postgres 中使用模式
【8月更文挑战第11天】
500 0
在 Postgres 中使用模式
|
SQL 关系型数据库 数据库
AWS Database Migration Service (DMS)
AWS Database Migration Service (DMS)
480 3
Vue3-admin-template的表格合计计算
Vue3-admin-template的表格合计计算
169 0
|
Linux Shell Docker
docker--Dockerfile、构建 python 镜像
docker--Dockerfile、构建 python 镜像