开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

什么是 CDC?

什么是 CDC?

展开
收起
Lee_tianbai 2021-01-07 16:19:41 2256 0
1 条回答
写回答
取消 提交回答
  • Change Data Capture(CDC)用来跟踪捕获数据源的数据变化,并将这些变化同步 到目标存储(如数据湖或数据仓库),用于数据备份或后续分析,同步过程可以是分钟/小时/ 天等粒度,也可以是实时同步。CDC 方案分为侵入式(intrusive manner)和非倾入性 (non-intrusive manner)两种。

    image.png

    2021-01-07 16:19:58
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
《基于Apache Hudi的CDC数据入湖》 立即下载
基于 Flink SQL + Paimon 构建流式湖仓新方 立即下载
Flink Streaming SQL 2018 立即下载

相关实验场景

更多