开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

我们现在有一个mongoDB-cdc的任务一天前失败了,但是没有报警,所以今天才发现,但是想要从ch

我们现在有一个mongoDB-cdc的任务一天前失败了,但是没有报警,所以今天才发现,但是想要从checkpoint重启时报下面的错误,看样子应该是resumeToken失效的缘故。请问下,这种情况是不是只能依靠监控来及时的趁resumeToken还没失效就赶紧修复并恢复任务?还有别的方式么?Caused by: com.mongodb.MongoCommandException: Command failed with error 286 (ChangeStreamHistoryLost): 'Resume of change stream was not possible, as the resume point may no longer be in the oplog.' on server 192.168.0.202:3717. The full response is {"errorLabels": ["NonResumableChangeStreamError"], "operationTime": {"$timestamp": {"t": 1666087462, "i": 46}}, "ok": 0.0, "errmsg": "Resume of change stream was not possible, as the resume point may no longer be in the oplog.", "code": 286, "codeName": "ChangeStreamHistoryLost", "$clusterTime": {"clusterTime": {"$timestamp": {"t": 1666087462, "i": 46}}, "signature": {"hash": {"$binary": {"base64": "KgLy18PJF1vX/OcP8UMErIXSpj4=", "subType": "00"}}, "keyId": 7125022634332389401}}} at com.mongodb.internal.connection.ProtocolHelper.getCommandFailureException(ProtocolHelper.java:195)image.png

展开
收起
雪哥哥 2022-10-24 17:05:36 588 0
1 条回答
写回答
取消 提交回答
  • 有条件的话可以适当调大oplog的容量,加上监控也比较好(此答案整理自Flink CDC 社区)

    2022-10-24 18:13:26
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
MongoDB多数据中心的方案选型之路 立即下载
阿里云MongoDB云服务构建 立即下载
饿了么高级架构师陈东明:MongoDB是如何逐步提高可靠性的 立即下载