datastage 配置 增量抽取

简介: 1 三个控件:   TRANSFORMER:对于任何需要转换的数据集合进行转化并负责传入到其他活动的STAGE SELECT XM XM_BM,XB XB_BM, F_15TO18(SFZH) SFZH,AGE AGE_BM FROM XXX   ORACLE CONNECTOR:连接Oracle数据,传送或者被写入数据。

1

三个控件:

 

TRANSFORMER:对于任何需要转换的数据集合进行转化并负责传入到其他活动的STAGE

SELECT XM XM_BM,XB XB_BM, F_15TO18(SFZH) SFZH,AGE AGE_BM

FROM XXX

 

ORACLE CONNECTOR:连接Oracle数据,传送或者被写入数据。

INSERT 

UPDATE

SELECT 

DELETE

 

 

AGGREGATOR:对于单一的输入数据进行分组并且计算每一组的合计和总计

ASH:最好自定义,这样子数据就比较全面

SELECT MAX(AGE_BM) ,ASH FROM XXX GROUP BY ASH;

 

A经过转换出来 将符合的字段传入B中,其中在转换过程中,取出A的最大时间戳并将其传入到时间戳表中。

 

A下次活动时取出时间戳之后的值将其存入到B

 

这样的话就需给A赋值

 

右击方案的PROPERTIES

添加时间戳类型一般默认为STRING


 

 

上面的方案主要解决存入数据并将最大时间戳存入到数据库中

现在如何将变量传送进去

 

2

 

HASH FILE:可以认为是一个txt文件存储关键字和时间戳

 

A的时间戳值存入到HASH_FILE

 

3

 

JOB ACTIVITY:类似Oraclejob

 

HASH_FILE读取数据并传入1

目录
相关文章
|
5月前
|
SQL DataWorks 安全
DataWorks产品使用合集之实时同步时如何修改binlog抽取数量
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6月前
|
数据采集 分布式计算 大数据
MaxCompute产品使用合集之数据集成中进行数据抽取时,是否可以定义使用和源数据库一样的字符集进行抽取
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
8月前
|
SQL 算法 关系型数据库
实时计算 Flink版产品使用合集之全量历史数据比较多,全量同步阶段时间长,是否会同时读取binlog进行合并输出
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
SQL
过配置数据集的增量同步任务
过配置数据集的增量同步任务
145 1
|
数据采集 数据库 调度
数据抽取清洗转换加载工具ETL
应用场景 当你想通过工具,从一个数据库将数据进行清洗后搬迁到另一个数据库,那么就可以通过ETL的数据抽取清洗转换加载工具来操作。
2560 0
|
存储 算法 索引
如何实现文件增量同步——算法
问题: 如何增量同步文件,例如一个文本文件有10M,分别存放在A,B两个地方,现在两个文件是完全一样的,但是我马上要在A上对这个文件进行修改,B如何实现自动和A上的文件保持一致,并且网络的传输量最少。
1470 0
|
数据采集 SQL 关系型数据库
【笔记】最佳实践—如何优化数据全量抽取
本文介绍了在应用内通过代码高效抽取数据的方法。
131 0
|
数据采集 SQL 关系型数据库
最佳实践—如何优化数据全量抽取
本文介绍了在应用内通过代码高效抽取数据的方法。
286 0
|
SQL 存储 监控
从Zabbix数据库入手,获取更详细的审计日志
从Zabbix数据库入手,获取更详细的审计日志
456 0