开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据集成中的实时同步任务有类似bug的表现, 请问这个符合预期吗?

DataWorks数据集成中的实时同步任务有类似bug的表现, 从mysql表到odps表,当mysql中新增一条数据时,odps会新增一条数据。但是当mysql删除这条数据时,odps还会继续新增这条删除的数据。请问这个符合预期吗?

展开
收起
真的很搞笑 2023-11-13 11:17:17 31 0
3 条回答
写回答
取消 提交回答
  • DataWorks数据集成中的实时同步任务设计初衷是将源端数据库中部分或全部表的数据变化实时同步至目标数据库中,以实现目标库与源库的数据对应。根据您的描述,当MySQL中删除一条数据时,ODPS还会继续新增这条已删除的数据,这显然是不符合预期的。

    该情况可能是由于实时同步任务的延迟或其他配置问题导致的。如果发现数据未同步,您可以进入运维中心的实时同步任务界面,查看任务的业务延迟数值是否过大。此外,也可能存在其他原因导致的问题,如同步没有主键的表、临时AK超过7天自动过期等。

    2023-11-30 17:05:57
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    这种情况不符合预期,因为DataWorks 数据集成中的实时同步任务应当按照“全量 + 增量”的方式进行数据同步,即在全量同步的基础上,每次只增加新的数据或更新现有的数据,而不应再重复添加已经被删除的数据。请您检查您的配置是否正确,以及您的数据是否发生了异常情况,例如数据冲突或并发写入等问题

    2023-11-13 14:30:22
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载