DataWorks百问百答56:数据集成同步中的增量同步功能如何配置?

本文涉及的产品
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
简介: 常见数据源增量同步技巧

背景

数据集成同步中的增量同步功能在现在很多用户日常的任务中占据的比例越来越多,意义很多时候比全量同步还大,但是很多用户在使用增量同时,遇到了不知道该如何配置参数的问题,面对纷繁复杂的数据库种类,每种类型都略有不同。下面就给您介绍一下使用不同数据库时可以使用的增量查询条件,干货满满,可以收藏保存。

数据源配置技巧

image.png
如图,具备增量同步的数据源都需要在数据过滤的地方填写对应的过滤语句,您可以通过数据表的时间列(比如gmt_modify、gmt_update)获取某一个时间范围内的增量数据(示例中为天增量${bizdate},您可以配合其他调度参数做小时增量),不同数据库的增量查询where条件略有区别。具体参考如下:

MySQL、DRDS、ADS、AnalyticDB for MySQL、PolarDB(MySQL引擎)、HybridDB for MySQL

STR_TO_DATE('${bizdate}', '%Y%m%d') <= 
增量时间列 AND 增量时间列 
< DATE_ADD(STR_TO_DATE('${bizdate}', '%Y%m%d'), interval 1 day)

Oracle、PostgreSQL

TO_DATE('${bizdate}', 'yyyymmdd') <= 
增量时间列 AND 增量时间列 
< TO_DATE('${bizdate}', 'yyyymmdd') + 1

SQL Server

CONVERT(datetime, '${bizdate}') <= 
增量时间列 AND 增量时间列 
< DATEADD(day, 1, CONVERT(datetime, '${bizdate}'))

调度配置关键步骤

配置好同步过滤参数后,对于调度也是要打好配合的,上面实例选择的按天进行过滤数据,那么同样的调度参数里我们也要设置为按天调度:
image.png

关键参数如下:

参数 含义
生成实例方式 【T+1次日生成】:任务发布后的第二天才会有对应的实例开始执行
【发布后即时生成】:如果任务发布的当前时间在允许调度执行的时间之前,那么立刻就生成实例,在调度时间到达后实例就会执行,否则不生成实例。
调度周期 设置按照“分、小时、日、周、月”这样的周期循环单位
具体时间 在设置完调度周期之后,设置每一个周期里具体调度的时间点

最后发布或者提交之后,在运维就可以看到实例了,然后每个循环周期都会对应的生成,并执行增量同步任务。

总结

一句话,在数据集成中的将过滤的增量数据设置,同调度的周期保持一致,即可以保证不遗漏任何增量,按期所有数据妥妥入库,您Get到了吗?

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

相关文章
|
18天前
|
安全 定位技术 API
婚恋交友系统匹配功能 婚恋相亲软件实现定位 语音社交app红娘系统集成高德地图SDK
在婚恋交友系统中集成高德地图,可实现用户定位、导航及基于地理位置的匹配推荐等功能。具体步骤如下: 1. **注册账号**:访问高德开放平台,注册并创建应用。 2. **获取API Key**:记录API Key以备开发使用。 3. **集成SDK**:根据开发平台下载并集成高德地图SDK。 4. **配置功能**:实现定位、导航及基于位置的匹配推荐。 5. **注意事项**:保护用户隐私,确保API Key安全,定期更新地图数据,添加错误处理机制。 6. **测试优化**:完成集成后进行全面测试,并根据反馈优化功能。 通过以上步骤,提升用户体验,提供更便捷的服务。
|
3月前
|
传感器 监控 搜索推荐
智能服装:集成健康监测功能的纺织品——未来穿戴科技的新篇章
【10月更文挑战第7天】智能服装作为穿戴科技的重要分支,正以其独特的技术优势和广泛的应用前景,成为未来科技发展的亮点之一。它不仅改变了我们对服装的传统认知,更将健康监测、运动训练、医疗康复等功能融为一体,为我们的生活带来了更多的便利和可能。随着技术的不断进步和市场的日益成熟,我们有理由相信,智能服装将成为未来穿戴科技的新篇章,引领我们走向更加健康、智能、可持续的生活方式。
|
3月前
|
前端开发 JavaScript UED
探索Python Django中的WebSocket集成:为前后端分离应用添加实时通信功能
通过在Django项目中集成Channels和WebSocket,我们能够为前后端分离的应用添加实时通信功能,实现诸如在线聊天、实时数据更新等交互式场景。这不仅增强了应用的功能性,也提升了用户体验。随着实时Web应用的日益普及,掌握Django Channels和WebSocket的集成将为开发者开启新的可能性,推动Web应用的发展迈向更高层次的实时性和交互性。
113 1
|
10天前
|
人工智能 数据处理 C#
AI Dev Gallery:微软开源 Windows AI 模型本地运行工具包和示例库,助理开发者快速集成 AI 功能
微软推出的AI Dev Gallery,为Windows开发者提供开源AI工具包和示例库,支持本地运行AI模型,提升开发效率。
52 13
|
17天前
|
人工智能 自然语言处理 搜索推荐
Open Notebook:开源 AI 笔记工具,支持多种文件格式,自动转播客和生成总结,集成搜索引擎等功能
Open Notebook 是一款开源的 AI 笔记工具,支持多格式笔记管理,并能自动将笔记转换为博客或播客,适用于学术研究、教育、企业知识管理等多个场景。
82 0
Open Notebook:开源 AI 笔记工具,支持多种文件格式,自动转播客和生成总结,集成搜索引擎等功能
|
2月前
|
缓存 资源调度 JavaScript
Vue集成Excalidraw实现在线画板功能
Excalidraw是一款开源在线绘图工具,适用于白板、思维导图、原型设计等场景。支持手绘风格、多种图形元素、导出功能及多人协作,深受开发者喜爱。本文档介绍了如何在Vue项目中集成Excalidraw,包括安装依赖、配置文件修改、页面添加等步骤,帮助开发者快速上手。
181 0
Vue集成Excalidraw实现在线画板功能
|
2月前
|
传感器 前端开发 Android开发
在 Flutter 开发中,插件开发与集成至关重要,它能扩展应用功能,满足复杂业务需求
在 Flutter 开发中,插件开发与集成至关重要,它能扩展应用功能,满足复杂业务需求。本文深入探讨了插件开发的基本概念、流程、集成方法、常见类型及开发实例,如相机插件的开发步骤,同时强调了版本兼容性、性能优化等注意事项,并展望了插件开发的未来趋势。
49 2
|
2月前
|
SQL 开发框架 .NET
突破T-SQL限制:利用CLR集成扩展RDS SQL Server的功能边界
CLR集成为SQL Server提供了强大的扩展能力,突破了T-SQL的限制,极大地拓展了SQL 的应用场景,如:复杂字符串处理、高性能计算、图像处理、机器学习集成、自定义加密解密等,使开发人员能够利用 .NET Framework的丰富功能来处理复杂的数据库任务。
|
2月前
|
JSON Java API
springboot集成ElasticSearch使用completion实现补全功能
springboot集成ElasticSearch使用completion实现补全功能
49 1
|
3月前
|
人工智能 JavaScript 网络安全
ToB项目身份认证AD集成(三完):利用ldap.js实现与windows AD对接实现用户搜索、认证、密码修改等功能 - 以及针对中文转义问题的补丁方法
本文详细介绍了如何使用 `ldapjs` 库在 Node.js 中实现与 Windows AD 的交互,包括用户搜索、身份验证、密码修改和重置等功能。通过创建 `LdapService` 类,提供了与 AD 服务器通信的完整解决方案,同时解决了中文字段在 LDAP 操作中被转义的问题。

热门文章

最新文章

相关产品

  • 大数据开发治理平台 DataWorks