实时计算 Flink版操作报错合集之一直无法正常运行，并且网络状况良好，是什么原因导致的-阿里云开发者社区

实时计算 Flink版操作报错合集之一直无法正常运行，并且网络状况良好，是什么原因导致的

2024-05-18 438

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在使用实时计算Flink版过程中，可能会遇到各种错误，了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题，查看Flink的日志是关键，它们通常会提供更详细的错误信息和堆栈跟踪，有助于定位问题。此外，Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

问题一：Flink CDC中mysql 同步kafka 给报了个这错？

Flink CDC中mysql 同步kafka 给报了个这错， sink是侧输出流表也不大就400万，列有200列，初始化的时候报的有遇到过的吗？

参考回答：

这个错误是由于Kafka生产者尝试使用旧的epoch进行生产导致的。要解决这个问题，你可以尝试以下方法：

确保Flink CDC和Kafka的版本兼容。你可以查看官方文档或者在社区中寻求帮助。
检查Kafka集群的状态，确保所有broker都正常运行。
检查Flink CDC的配置，确保sink.producer.type设置为KafkaProducer，并且sink.producer.bootstrap.servers指向正确的Kafka broker地址。
如果问题仍然存在，可以尝试增加Kafka producer的max.block.ms参数值，以便给生产者更多的时间来更新其epoch。例如，将max.block.ms设置为60000（1分钟）：

flink-cdc:
  sink:
    type: kafka
    properties:
      topic: your_topic
      bootstrap.servers: your_kafka_bootstrap_servers
      key.serializer: org.apache.kafka.common.serialization.StringSerializer
      value.serializer: org.apache.kafka.common.serialization.StringSerializer
      producer.type: KafkaProducer
      producer.bootstrap.servers: your_kafka_bootstrap_servers
      producer.key.serializer: org.apache.kafka.common.serialization.StringSerializer
      producer.value.serializer: org.apache.kafka.common.serialization.StringSerializer
      producer.max.block.ms: 60000

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570654

问题二：Flink CDC中mysql cdc经常出现这个问题？

Flink CDC中mysql cdc经常出现这个问题？Caused by: com.github.shyiko.mysql.binlog.event.deserialization.EventDataDeserializationException: Failed to deserialize data of EventHeaderV4{timestamp=1699418446000, eventType=UPDATE_ROWS, serverId=491473306, headerLength=19, dataLength=6761, nextPosition=176286618, flags=0}设置了参数后虽然任务没失败但是一直在restaring？网上大部分说是网络问题但是让基础网络的看了下说是稳定的一直被这个问题困扰execution.checkpointing.interval=10min

execution.checkpointing.tolerable-failed-checkpoints=100

restart-strategy=fixed-delay

restart-strategy.fixed-delay.attempts=2147483647

restart-strategy.fixed-delay.delay= 30s，这些参数都设置了一直在重启 flink任务也不失败一直在restaring

参考回答：

如果 Flink CDC 一直无法正常运行，并且网络状况良好，则可能与以下因素有关：

系统资源紧张：Flink CDC 需要足够的系统资源才能正常运行，包括 CPU、内存、磁盘空间和其他资源。如果系统资源紧张，则可能导致任务重启。
数据流过多：如果 CDC 数据流过多，则可能导致任务负担过大而重启。
代码错误或 bug：如果您的代码中有错误或 bug，则可能导致任务无法正常运行。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570646

问题三：Flink CDC有遇到oracle cdc全量同步完后，提交offset的时候报这个错误？

Flink CDC有遇到oracle cdc全量同步完后，提交offset的时候报这个错误，本地调试的时候没这个错误，可以正常同步，到flink集群中运行的时候才报这个错误？

参考回答：

这个错误是因为Flink CDC在Oracle CDC全量同步完成后，提交offset时，无法从Oracle CDC中获取到最新的change event。这可能是因为Oracle CDC的配置问题，或者是因为Flink CDC和Oracle CDC之间的连接问题。在本地调试时，可能是因为你本地的Oracle CDC环境和Flink CDC环境配置一致，所以能够正常同步和提交offset。但是在集群环境中，可能因为网络环境、Oracle CDC的配置、Flink CDC的配置等因素，导致无法正确获取到最新的change event，从而导致这个错误。建议检查Oracle CDC的配置，确保其能够正确同步和提交offset，同时检查Flink CDC的配置，确保其能够正确连接和使用Oracle CDC。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570638

问题四：Flink CDC这个问题遇到过吗？

Flink CDC这个问题遇到过吗？ 2023-11-06T19:04:04.928076703+08:00由：java.lang.IllegalArgumentException引起：JDBC类型-5和列id BIGINT NOT NULL的意外值：class=class[B

参考回答：

这个问题可能是由于在Flink CDC中，JDBC类型-5与列id BIGINT NOT NULL的意外值不匹配导致的。为了解决这个问题，你可以尝试以下方法：

检查你的数据库表结构，确保列id的数据类型为BIGINT NOT NULL。
检查你的Flink CDC配置，确保使用正确的JDBC驱动和连接字符串。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570637

问题五：Flink CDC测试的到实例的权限只读就可以读取到数据但是到库到表都报错？

Flink CDC测试的到实例的权限只读就可以读取到数据但是到库到表都报错？Caused by: com.mongodb.MongoCommandException: Command failed with error 13 (Unauthorized): 'not authorized on admin to execute command { aggregate: 1, pipeline: [ { $changeStream: { allChangesForCluster: true } } ], cursor: { batchSize: 1 }, $db: "admin", $clusterTime: { clusterTime: Timestamp(1699422172, 1), signature: { hash: BinData(0, 4D6D5F6D922D32E4E87A7A0DB418837C42205042), keyId: 7256179845946671105 } }, lsid: { id: UUID("9a93b977-05c6-40cd-9933-07831134faf9") }, $readPreference: { mode: "secondaryPreferred" } }' on server dds-uf628e326955e1342.mongodb.rds.aliyuncs.com:3717. The full response is {"operationTime": {"$timestamp": {"t": 1699422172, "i": 1}}, "ok": 0.0, "errmsg": "not authorized on admin to execute command { aggregate: 1, pipeline: [ { $changeStream: { allChangesForCluster: true } } ], cursor: { batchSize: 1 }, $db: \"admin\", $clusterTime: { clusterTime: Timestamp(1699422172, 1), signature: { hash: BinData(0, 4D6D5F6D922D32E4E87A7A0DB418837C42205042), keyId: 7256179845946671105 } }, lsid: { id: UUID(\"9a93b977-05c6-40cd-9933-07831134faf9\") }, $readPreference: { mode: \"secondaryPreferred\" } }", "code": 13, "codeName": "Unauthorized", "$clusterTime": {"clusterTime": {"$timestamp": {"t": 1699422172, "i": 1}}, "signature": {"hash": {"$binary": {"base64": "TW1fbZItMuToenoNtBiDfEIgUEI=", "subType": "00"}}, "keyId": 7256179845946671105}}}感觉就是权限没给到位的感觉

参考回答：

not authorized on admin to execute command { aggregate: 1, pipeline: [ { $changeStream: { allChangesForCluster: tr

https://github.com/ververica/flink-cdc-connectors/pull/1938这是个之前的bug，在2.4.0修复了，试试2.4.0以上看看

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570632

实时计算 Flink版操作报错合集之一直无法正常运行，并且网络状况良好，是什么原因导致的

问题一：Flink CDC中mysql 同步kafka 给报了个这错？

问题二：Flink CDC中mysql cdc经常出现这个问题？

问题三：Flink CDC有遇到oracle cdc全量同步完后，提交offset的时候报这个错误？

问题四：Flink CDC这个问题遇到过吗？

问题五：Flink CDC测试的到实例的权限只读就可以读取到数据但是到库到表都报错？