Flink CDC Caused by: org.apache.hadoop.ipc.RemoteException: File /flink/yarn/ha/default/blob/job_d8abd7d1c158e3ed63a553ee04175a81/blob_p-143fd61770897b4898cae98fa60efb5d0dabe1ef-2f6bfb3bea4e4f49f7ffeaf5cf46b66a could only be written to 0 of the 1 minReplication nodes. There are 1 datanode(s) running and 0 node(s) are excluded in this operation. 请教下大家,我在这又卡住了。flink 消费kafka数据,idea能正常消费,但是提交flink的jar包运行还是报这个错?(这是flink webui界面的logs提示)
tidb-cdc目前没有实现增量快照框架,无法实现,和flink版本没关系, 没资源了。你可以用datax之类的导一份全量数据,然后tidb-cdc走增量数据,此回答整理自钉群“Flink CDC 社区”
你的问题是关于Apache Flink在处理Kafka数据时遇到的问题,具体表现为HDFS文件写入失败。这个错误的原因是HDFS集群没有足够的datanode来满足文件的写入要求。
错误消息提示“File /flink/yarn/ha/default/blob/job_d8abd7d1c158e3ed63a553ee04175a81/blob_p-143fd61770897b4898cae98fa60efb5d0dabe1ef-2f6bfb3bea4e4f49f7ffeaf5cf46b66a could only be written to 0 of the 1 minReplication nodes. There are 1 datanode(s) running and 0 node(s) are excluded in this operation.” 这表明尝试写入的文件需要至少一个副本(minReplication),但是目前没有可用的datanode来存储副本。
这个问题可能有以下几个原因:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。