开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

云原生大数据计算服务 MaxCompute数据上云方面,全增量实时一键数据同步MaxCompute方

已解决

云原生大数据计算服务 MaxCompute数据上云方面,全增量实时一键数据同步MaxCompute方案是怎样的?

展开
收起
詹姆斯邦德00 2022-10-17 10:57:17 830 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    此处以MySQL业务数据库为例,假设有大量的数据存储在数据库系统里,需要将数据库中的全量及增量数据同步到MaxCompute中进行数仓分析,数据集成传统方式是通过DataX进行全量同步或者依赖数据库表中有modify_time这种字段进行增量同步。但实际的生产场景中,数据库表里并不一定存在modify_time这种字段,传统的基于jdbc抽取的方式则没办法进行增量同步。

    该场景主要抽象为三个核心需求点:

    1.全量数据初始化;

    2.增量数据实时写入;

    3.增量数据和全量数据定时做合并写入新的全量表分区。

    image.png

    以上内容摘自《企业级云原生白皮书项目实战》电子书,点击https://developer.aliyun.com/ebook/download/7774可下载完整版

    2022-10-17 18:57:04
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 热门讨论

    热门文章

    相关电子书

    更多
    MaxCompute架构升级及开放性解读 立即下载
    MaxCompute半结构化数据思考与创新 立即下载
    MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载