带你读《全链路数据治理-全域数据集成》之6:3. 实时同步场景与配置

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 带你读《全链路数据治理-全域数据集成》之6:3. 实时同步场景与配置

3. 实时同步场景与配置


1) 单表 ETL 实时同步


l 将单个表或者 topic 内的数据同步到另外一个表中,整个流程支持图形化开

发无需编写代码,单表实时同步至单表时,支持使用托拽的方式实现任务开

发,业务新手也能够轻松上手。


l 单表增量数据实时同步场景下,您可以根据业务需求,对输入数据源进行数

据过滤、字符串替换和数据脱敏处理后,再将数据输出至目标数据库。


Ø 数据过滤:可以对数据进行规则过滤,例如过滤字段的大小等,符合规

则的数据才会被保留。

Ø 字符串替换:可以通过字符串替换节点替换字符串类型的字段。

Ø 数据脱敏:可以对实时同步的单表数据进行脱敏,将脱敏后的数据输出

至目标数据库。


l 具体配置方案请参考配置实时同步任务


2) 整库实时同步


l 将整个数据库的变化日志同步到目标端中,一般用作纯实时日志的收集。

l 可以一次性配置一个实例下多个库的多个表,一个任务中最多支持 3000 个

目标表。

l 具体配置方案请参考配置实时同步任务


3) 整库全增量实时同步


l 是实时同步使用最频繁的业务场景,一般用作将源端库持续不停地同步到

目标端中,以期实现目标端对于源端的镜像效果。

l 可以一次性配置一个实例下多个库的多个表,一个任务中最多支持 3000 个

目标表。

l 除了直接使用已有表作为目标表,也支持自动生成目标 schema/表,并且

可以自定义目标 schema/表名生成规则。

l 支持目标表添加附加字段,实时同步默认按照默认按照同名映射,源端同名

字段写入目标端同名字段,未映射成功的字段将不参与同步,但支持您定义

目标表字段与值。

l 数据集成实时同步在同步 MySQL、Oracle、Loghub 和 PolarDB 类型的数

据至 DataHub 或 Kafka 时,会在同步的目标端添加 5 个附加列,以进行元

数据管理、排序去重等操作。详情请参见实时同步字段格式

l 支持定义 DDL/DML 消息处理策略,为保障数据符合预期,实时同步任务支

持对不同类型的 DDL/DML 消息定义不同的处理策略。

l 具体配置方案请参考配置同步任务解决方案

相关文章
|
1月前
|
缓存 Java API
微服务——SpringBoot使用归纳——Spring Boot集成 Swagger2 展现在线接口文档——Swagger2 的配置
本文介绍了在Spring Boot中配置Swagger2的方法。通过创建一个配置类,添加`@Configuration`和`@EnableSwagger2`注解,使用Docket对象定义API文档的详细信息,包括标题、描述、版本和包路径等。配置完成后,访问`localhost:8080/swagger-ui.html`即可查看接口文档。文中还提示了可能因浏览器缓存导致的问题及解决方法。
71 0
微服务——SpringBoot使用归纳——Spring Boot集成 Swagger2 展现在线接口文档——Swagger2 的配置
|
16天前
|
缓存 前端开发 API
(网页系统集成CAD功能)在线CAD中配置属性的使用教程
本文介绍了Mxcad SDK在线预览和编辑CAD图纸的功能及配置方法。通过Vite、CDN或Webpack实现集成,用户可自定义设置以满足项目需求。主要内容包括:1)`createMxCad()`方法的初始属性配置,如画布ID、WASM文件路径、字体加载路径等;2)`MxFun.setIniset()`方法提供的更多CAD初始配置;3)`McObject`对象API用于动态调整视图背景色、浏览模式等。此外,还提供了在线Demo(https://demo2.mxdraw3d.com:3000/mxcad/)供用户测试实时效果。
|
2月前
|
Cloud Native Java Nacos
springcloud/springboot集成NACOS 做注册和配置中心以及nacos源码分析
通过本文,我们详细介绍了如何在 Spring Cloud 和 Spring Boot 中集成 Nacos 进行服务注册和配置管理,并对 Nacos 的源码进行了初步分析。Nacos 作为一个强大的服务注册和配置管理平台,为微服务架构提供
503 14
|
1月前
|
SQL 弹性计算 DataWorks
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
|
28天前
|
JSON 分布式计算 DataX
【YashanDB知识库】使用DataX工具迁移yashan数据到maxcompute
本文介绍使用崖山适配的DataX工具进行数据库迁移的方法,包括单表迁移和批量表迁移。单表迁移需配置json文件并执行同步命令;批量迁移则通过脚本自动化生成json配置文件并完成数据迁移,最后提供数据比对功能验证迁移结果。具体步骤涵盖连接信息配置、表清单获取、json文件生成、数据迁移执行及日志记录,确保数据一致性。相关工具和脚本简化了复杂迁移过程,提升效率。
|
1月前
|
Java 数据库连接 数据库
微服务——SpringBoot使用归纳——Spring Boot集成MyBatis——MyBatis 介绍和配置
本文介绍了Spring Boot集成MyBatis的方法,重点讲解基于注解的方式。首先简述MyBatis作为持久层框架的特点,接着说明集成时的依赖导入,包括`mybatis-spring-boot-starter`和MySQL连接器。随后详细展示了`properties.yml`配置文件的内容,涵盖数据库连接、驼峰命名规范及Mapper文件路径等关键设置,帮助开发者快速上手Spring Boot与MyBatis的整合开发。
110 0
|
1月前
|
缓存 Java 应用服务中间件
微服务——SpringBoot使用归纳——Spring Boot集成Thymeleaf模板引擎——依赖导入和Thymeleaf相关配置
在Spring Boot中使用Thymeleaf模板,需引入依赖`spring-boot-starter-thymeleaf`,并在HTML页面标签中声明`xmlns:th="http://www.thymeleaf.org"`。此外,Thymeleaf默认开启页面缓存,开发时建议关闭缓存以实时查看更新效果,配置方式为`spring.thymeleaf.cache: false`。这可避免因缓存导致页面未及时刷新的问题。
46 0
|
8月前
|
Java Maven
2022最新版超详细的Maven下载配置教程、IDEA中集成maven(包含图解过程)、以及导入项目时jar包下载不成功的问题解决
这篇文章是一份关于Maven的安装和配置指南,包括下载、环境变量设置、配置文件修改、IDEA集成Maven以及解决jar包下载问题的方法。
2022最新版超详细的Maven下载配置教程、IDEA中集成maven(包含图解过程)、以及导入项目时jar包下载不成功的问题解决
|
4月前
|
人工智能 安全 DataX
【瓴羊数据荟】 Data x AI :大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期
第三期瓴羊数据Meetup 将于2025年1月3日在线上与大家见面,共同探讨AI时代的数据治理实践。
387 10
【瓴羊数据荟】 Data x  AI :大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期
|
9月前
|
NoSQL Java Nacos
SpringCloud集成Seata并使用Nacos做注册中心与配置中心
SpringCloud集成Seata并使用Nacos做注册中心与配置中心
354 3

热门文章

最新文章