开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

麻烦问下maxcompute能不能做增量同步的操作。就是次日凌晨把mysql里面今天的发生了变更的数

麻烦问下maxcompute能不能做增量同步的操作。就是次日凌晨把mysql里面今天的发生了变更的数据同步到maxcompute? 我不希望每一次数据同步都要把旧数据全部删除后再插入。 比如1号有 id为 1-10的十条数据产生,我通过离线同步到了maxcompute, 2号这天 这十条数据里面 id=1 和id=2这两条数据发生了变更,部分字段的值更改了。同时产生了id= 11和id= 12这两条新数据。 我能不能在同步的时候只更新id=1和2的这两条数据,并且插入id=11和12的这两条数据, id=3到id=10这八条数据不去动它?直接离线同步的话就等于把旧数据全部删除了之后再拉一遍数据,消耗资源很大。还有您说的maxcompute的普通表是什么意思?还有别的类型的表吗? 8bc32f1fe695d69ff0c77de33037afc0.png 是不是只有这种方案才能解决增量同步的问题?人工建表之后再merge?

展开
收起
十一0204 2023-04-06 12:50:41 171 0
1 条回答
写回答
取消 提交回答
  • 意中人就是我呀!

    "不行呀 mc不支持更新数据 所以是join了中间表以后直接插入分区的 可以参考看下同步提速的通用方式 https://developer.aliyun.com/article/979768?spm=a2c6h.12873639.article-detail.61.7d3372fbxsL4Iz 有事务表或者公测的项目支持修改 但是集成任务作为下游还未支持。 一键实时同步到mc现在应该是可以选择不同步历史数据的 只同步实时增量数据。此回答整理自钉群“DataWorks交流群(答疑@机器人)”"

    2023-04-06 15:16:29
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载

    相关镜像