开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

我是用爬虫获取数据全量存储到ods层,使用的按最新的同步吗?

我是用爬虫获取数据全量存储到ods层,使用flinkcdc同步ods层的数据到dwd。但是。ods层数据插入了66908条。而dwd层,只同步成功了488条。数据为做筛选。使用的按最新的同步?image.png

展开
收起
真的很搞笑 2023-09-28 10:00:59 56 0
1 条回答
写回答
取消 提交回答
  • 不过你这个快照模式只捕获connector启动之后变化的数据,此回答整理自钉群“Flink CDC 社区”

    2023-09-28 10:23:46
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
Python第五讲——关于爬虫如何做js逆向的思路 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载