实时计算 Flink版操作报错合集之写入hudi时报错，该如何排查-阿里云开发者社区

实时计算 Flink版操作报错合集之写入hudi时报错，该如何排查

2024-07-17 609

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在使用实时计算Flink版过程中，可能会遇到各种错误，了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题，查看Flink的日志是关键，它们通常会提供更详细的错误信息和堆栈跟踪，有助于定位问题。此外，Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

问题一：Flink CDC里这个入参json为什么会变成这样？

Flink CDC里这个入参json为什么会变成这样？代码是这样的，拿到json就是乱七八糟，不知道为什么？

参考答案：

从您提供的信息来看，Flink CDC在处理JSON数据时遇到了语法错误。具体来说，它期望的是一个以"f"或"["开头的JSON对象，但实际上却遇到了一个以"error"开头的字符串。这可能是由于输入数据中存在格式错误或者不规范的数据导致的。

要解决这个问题，您可以检查输入数据的格式是否正确，确保它们符合预期的JSON格式。此外，您还可以考虑使用异常处理机制来捕获并处理可能出现的语法错误，以便在出现问题时能够及时发现并进行相应的处理。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/590853

问题二：Flink CDC里版本全量会对生产有些影响，该怎么解决？

Flink CDC里版本flink-sql-connector-postgres-cdc-2.4.0.jar的postgresql-cdc使用增量快照就会报错slot already exits，改变成全量就好了，但是全量会对生产有些影响，该怎么解决？postgresql如果全量快照的话，不会阻止其他表数据写入，是不是不会对生产造成影响。

参考答案：

slot中name 是唯一的。mysql-cdc现在默认是增量快照来读取历史数据的，如果你用pg这边也是增量快照读取历史数据也是无锁，建议测试用3.0。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/590850

问题三：flinkcdc 写入hudi报错怎么办？

flinkcdc 写入hudi报错：org.apache.flink.runtime.client.JobInitializationException: Could not start the JobMaster.

at org.apache.flink.runtime.jobmaster.DefaultJobMasterServiceProcess.lambda$new$0(DefaultJobMasterServiceProcess.java:97)

at java.util.concurrent.CompletableFuture.uniWhenComplete(CompletableFuture.java:774)

at java.util.concurrent.CompletableFuture$UniWhenComplete.tryFire(CompletableFuture.java:750)

at java.util.concurrent.CompletableFuture.postComplete(CompletableFuture.java:488)

at java.util.concurrent.CompletableFuture$AsyncSupply.run(CompletableFuture.java:1609)

at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)

at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)

at java.lang.Thread.run(Thread.java:750)

Caused by: java.util.concurrent.CompletionException: org.apache.flink.util.FlinkRuntimeException: Failed to create checkpoint storage at checkpoint coordinator side.

at java.util.concurrent.CompletableFuture.encodeThrowable(CompletableFuture.java:273)

at java.util.concurrent.CompletableFuture.completeThrowable(CompletableFuture.java:280)

at java.util.concurrent.CompletableFuture$AsyncSupply.run(CompletableFuture.java:1606)

... 3 more

Caused by: org.apache.flink.util.FlinkRuntimeException: Failed to create checkpoint storage at checkpoint coordinator side.

at org.apache.flink.runtime.checkpoint.CheckpointCoordinator.(CheckpointCoordinator.java:324)

参考答案：

这个错误是由于Flink在尝试创建检查点存储时失败导致的。可能的原因有很多，例如磁盘空间不足、文件系统权限问题等。你可以尝试以下方法来解决这个问题：

检查你的Kubernetes集群是否有足够的资源（如CPU和内存）来运行Flink任务。如果资源不足，你需要增加集群的资源或者优化你的Flink任务以减少资源使用。
检查你的Kubernetes集群的文件系统是否有足够的空间来存储检查点。如果空间不足，你需要清理一些不必要的文件或者增加文件系统的容量。
检查你的Kubernetes集群的权限设置，确保Flink进程有足够的权限来访问和操作文件系统。
检查你的Flink配置文件，确保所有的配置都是正确的。特别是关于检查点存储的配置，你需要确保它指向一个可用的存储位置。
如果以上方法都无法解决问题，你可能需要查看Flink的日志以获取更详细的错误信息。这可能会帮助你找到问题的根源。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/590849

问题四：Flink CDC里 cdc端应该如何加参数可以忽略这个错误？

Flink CDC里The driver could not establish a secure connection to SQL Server by using Secure Sockets Layer (SSL) encryption. Error: "The server selected protocol version TLS10 is not accepted by client preferences [TLS13, TLS12]". sqlserver版本太低不支持 tls1.2 1.3 cdc端应该如何加参数可以忽略这个错误？

参考答案：

参考

https://github.com/ververica/flink-cdc-connectors/issues/2991

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/590887

问题五：Flink CDC里是找不到该表明明数据库中有这个表啊为什么监控不到？

Flink CDC里Can't find any matched tables, please check your configured database-name: [demo] and table-name: [test] flink 配置root用户监控binlog 老是找不到该表明明数据库中有这个表啊为什么监控不到？

参考答案：

code+db.table 看一下。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/590881

实时计算 Flink版操作报错合集之写入hudi时报错，该如何排查

问题一：Flink CDC里这个入参json为什么会变成这样？

问题二：Flink CDC里版本全量会对生产有些影响，该怎么解决？

问题三：flinkcdc 写入hudi报错怎么办？

问题四：Flink CDC里 cdc端应该如何加参数可以忽略这个错误？

问题五：Flink CDC里是找不到该表明明数据库中有这个表啊为什么监控不到？