开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

"麻烦问下maxcompute能不能做增量同步的操作。就是次日凌晨把mysql里面今天的发生了变更的

"麻烦问下maxcompute能不能做增量同步的操作。就是次日凌晨把mysql里面今天的发生了变更的数据同步到maxcompute? 我不希望每一次数据同步都要把旧数据全部删除后再插入。 比如1号有 id为 1-10的十条数据产生,我通过离线同步到了maxcompute, 2号这天 这十条数据里面 id=1 和id=2这两条数据发生了变更,部分字段的值更改了。同时产生了id= 11和id= 12这两条新数据。 我能不能在同步的时候只更新id=1和2的这两条数据,并且插入id=11和12的这两条数据, id=3到id=10这八条数据不去动它?直接离线同步的话就等于把旧数据全部删除了之后再拉一遍数据,消耗资源很大。还有您说的maxcompute的普通表是什么意思?还有别的类型的表吗? 8bc32f1fe695d69ff0c77de33037afc0.png 是不是只有这种方案才能解决增量同步的问题?人工建表之后再merge?" image.png "麻烦问下maxcompute能不能做增量同步的操作。就是次日凌晨把mysql里面今天的发生了变更的数据同步到maxcompute? 我不希望每一次数据同步都要把旧数据全部删除后再插入。 比如1号有 id为 1-10的十条数据产生,我通过离线同步到了maxcompute, 2号这天 这十条数据里面 id=1 和id=2这两条数据发生了变更,部分字段的值更改了。同时产生了id= 11和id= 12这两条新数据。 我能不能在同步的时候只更新id=1和2的这两条数据,并且插入id=11和12的这两条数据, id=3到id=10这八条数据不去动它?直接离线同步的话就等于把旧数据全部删除了之后再拉一遍数据,消耗资源很大。还有您说的maxcompute的普通表是什么意思?还有别的类型的表吗? 8bc32f1fe695d69ff0c77de33037afc0.png 是不是只有这种方案才能解决增量同步的问题?人工建表之后再merge?"

展开
收起
十一0204 2023-04-05 06:12:20 162 0
1 条回答
写回答
取消 提交回答
  • 意中人就是我呀!

    不行呀 mc不支持更新数据 所以是join了中间表以后直接插入分区的 可以参考看下同步提速的通用方式 https://developer.aliyun.com/article/979768?spm=a2c6h.12873639.article-detail.61.7d3372fbxsL4Iz 有事务表或者公测的项目支持修改 但是集成任务作为下游还未支持。 一键实时同步到mc现在应该是可以选择不同步历史数据的 只同步实时增量数据。此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-04-05 11:24:47
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载

相关镜像