kettle数据同步的五种方案-阿里云开发者社区

开发者社区> shy丶gril> 正文

kettle数据同步的五种方案

简介:
+关注继续查看
数据同步:当数据源发生改变时,其他相关数据也跟着发展变化。根据需求不同可采取以下方案。

1.触发器

在数据库建立增删改的触发器。触发器将变更放到一张临时表里。oracle同步cdc

优点:实时同步
缺点:影响到业务系统,因为需要在业务系统建立触发器

2.日志

通过分析源数据库日志,来获得源数据库中的变化的数据。oracle异步cdc

优点:不影响业务系统
缺点:有一定得延时,对于没有提供日志分析接口的数据源,开发的难度比较大

3.时间戳

在要同步的源表里有时间戳字段,每当数据发生变化,时间戳会记录发生变化的时间

优点:基本不影响业务系统
缺点:要求源表必须有时间戳这一列

4.数据比较

通过比较两边数据源数据,来完成数据同步。一般用于实时性要求不高的场景。

优点:基本不影响业务系统
缺点:效率低

5. 全表拷贝

定时清空目的数据源,将源数据源的数据全盘拷贝到目的数据源。一般用于数据量不大,实时性要求不高的场景。

优点:基本不影响业务系统,开发、部署都很简单
缺点:效率低
总结:
1. 上面五种数据同步方式,除了第五种都需要业务表有主键。
2. 对于没有触发器和日志的一些小型数据源,如txt 文本,excel 文件,Aceess,则只能使用后三种方式。

3. 对于大型数据源,一般优先选择日志方式,如 ORCALE Asynchronized CDC, 对于不能通过日志来实现的情况,可以考虑第1,3,4种方式。

转载:http://blog.csdn.net/foreverling/article/details/10625701 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Kettle之数据抽取、转换、装载
Kettle 官网   ETL利器Kettle实战应用解析系列   利用kettle组件导入excel文件到数据库   kettle中实现动态SQL查询   java中调用kettle转换文件   kettle 7.
2100 0
20160331数据文件offline与open resetlogs
[20160331]数据文件offline与open resetlogs.txt --昨天不小心导致一个数据文件offline,而归档日志已经删除,无法在通过recover恢复到online,通过手工修改online数据文件。
806 0
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
6897 0
区块链数据分析必备工具BlockETL
BlockETL软件包用于比特币区块链数据分析中的数据抽取/转换/加载(ETL),可以从原始的比特币区块文件中抽取区块与交易数据并加载入通用SQL数据库,以便于后续的数据分析处理,非常适合区块链数据分析相关的毕业设计或课题研究项目。
1160 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7748 0
[ETL实践指南]基于Kettle的MaxCompute插件实现数据上云
本文用到的 阿里云数加-大数据计算服务MaxCompute产品地址:https://www.aliyun.com/product/odps 简介 Kettle是一款开源的ETL工具,纯java实现,可以运行于Windows, Unix, Linux上运行,提供图形化的操作界面,可以通过拖拽控件的方式,方便地定义数据传输的拓扑。
17448 0
+关注
1878
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载