1)对于数据抽取,在增量抽取时读或变化数据的方法应该能够优质廉价的准确捕获业务系统中的变化数据。尽量减少对业务系统造成的压力,避免影响到业务。目前补货变化的数据方式有触发器,这种方式主要是在抽取的表上建立插入、修改、删除等需要的触发器。每当原表中的数据发生变化时,就被相应的触发器将变化的数据写入到一个临时表中,抽取线程从临时表中抽取数据。
2)时间戳。这种方式是一种基于递增数据比较的增量数据补货方式,在原表上增加一个时间戳字段。在系统更新修改表数据时,同时修改时间错的字段的值当抽取数据时,通过比较系统的时间与时间戳字段的值来决定抽取哪些数据。
3)全表比较,最典型的方式就是采用MD5校验码。
4)日志比较,通过分析数据库自身的日志来判断变化的数据。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。