开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

mongcdc可以支持只读最新的数据吗,或者从指定时间读取?

mongcdc可以支持只读最新的数据吗,或者从指定时间读取?

展开
收起
滴滴滴~ 2023-03-21 09:10:45 228 0
4 条回答
写回答
取消 提交回答
  • copy.existing = false 此答案整理自钉群“Flink CDC 社区”

    2023-03-21 16:25:37
    赞同 展开评论 打赏
  • 坚持这件事孤独又漫长。

    MongCDC(MongoDB Change Data Capture)是MongoDB提供的一种实时数据捕获方式,可以捕获MongoDB副本集或分片集群的变更,MongoCDC支持两种模式:全量数据模式和增量数据模式。

    MongCDC增量模式可以通过指定从哪个开始时间点或者从哪个Oplog Offset开始读取增量数据,来实现只读最新的数据或者从指定时间读取的需求。具体实现方式如下:

    1. 指定时间读取:在启动MongCDC的时候,可以指定从哪个时间点之后开始读取数据变更,即指定起始时间点。启动方式如下:
    mongocdc -m <address>:<port> -d <db> -c <collection> --timestamp <datetime>
    

    其中,表示起始时间点,格式为YYYY-MM-DDTHH:mm:ssZ,例如2022-01-01T00:00:00Z。 这种方式可以用来读取特定时间段内的数据变更,忽略旧数据。

    1. 只读最新的数据:如果没有指定起始时间点,则MongCDC会从最新的Oplog Offset开始读取数据变更。 这种方式可以用来只读取最新的数据,忽略过时的记录。

    建议使用第二种方式,因为它可以保证只读取最新的数据,而不会触发不必要的操作和资源浪费。如果需要实现只读取特定时间段内的数据变更,请使用第一种方式,但需要注意的是,这种方式可能会读取一些过时的数据,需要根据实际需求进行考虑。

    2023-03-21 14:16:21
    赞同 展开评论 打赏
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    可以,尝试使用以下办法:

    只读最新数据或指定时间配置 在 MongoDB CDC 连接器的配置中指定 poll.max.batch.size 和 poll.interval.ms 选项及mongodb.initial.sync.timestamp.overrid配置

    {
      "name": "my-mongo-source",
      "connector.class": "debezium.connector.mongodb.MongoDbConnector",
      "mongodb.hosts": "localhost:27017",
      "mongodb.name": "mydb",
      "tasks.max": "1",
      "poll.max.batch.size": "100",
      "poll.interval.ms": "60000"
      "mongodb.initial.sync.timestamp.override": "2023-03-21T00:00:00Z"
    }
    }
    
    

    在这个配置中,将 poll.max.batch.size 设置为 100,将 poll.interval.ms 设置为 60000(1 分钟),mongodb.initial.sync.timestamp.override 设置为一个指定时间的 ISO 格式字符串,这样连接器每分钟只会读取 100 条最新的数据。

    2023-03-21 10:05:16
    赞同 展开评论 打赏
  • GitHub https://github.com/co63oc/cloud

    MongoDB CDC 连接器允许从 MongoDB 读取快照数据和增量数据 https://www.jianshu.com/p/cc4a6096f3d3

    2023-03-21 09:49:40
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载