备案控制台

开发者社区问答正文

flink 1.7.2集群异常退出

Hi，ALL

写了个测试程序，大概跑了不到三个小时，flink集群就挂了，所有节点退出，报错如下：

2019-03-12 20:45:14,623 INFO org.apache.flink.runtime.executiongraph.ExecutionGraph - Job Tbox from Kafka Sink To Kafka And Print (21949294d4750b869b341c5d2942d499) switched from state RUNNING to FAILING. org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.protocol.FSLimitException$MaxDirectoryItemsExceededException): The directory item limit of /tmp/ha is exceeded: limit=1048576 items=1048576

hdfs count结果：

2097151 4 124334563 hdfs://banma/tmp/ha

下面是flink-conf.yaml的配置：

[hdfs@qa-hdpdn06 flink-1.7.2]$ cat conf/flink-conf.yaml |grep ^[^#] jobmanager.rpc.address: 10.4.11.252 jobmanager.rpc.port: 6123 jobmanager.heap.size: 1024m taskmanager.heap.size: 1024m taskmanager.numberOfTaskSlots: 10 parallelism.default: 1 high-availability: zookeeper high-availability.storageDir: hdfs://banma/tmp/ha high-availability.zookeeper.quorum: qa-hdpdn05.ebanma.com:2181 rest.port: 8081

flink版本：官方最新的flink 1,7.2

为什么 high-availability.storageDir的目录会产生如此多的子目录？里面存的都是什么？什么情况下回触发这些存储操作？如何避免这个问题？

谢谢！*来自志愿者整理的flink邮件归档

展开

收起

毛毛虫雨 2021-12-07 13:56:08 778 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

雪哥哥

Hi 你是不是没有配置checkpoint path，且没有显式的配置FsStateBackend或者RocksDBStateBackend，这应该是一个MemoryStateBackend 在配置HA却没有配置checkpoint path时候的bug，参见我之前创建的JIRA https://issues.apache.org/jira/browse/FLINK-11107

相关PR已经提交了，不过社区认为MemoryStateBackend更多的是debug用或者实验性质的toy，不会有生产环境直接使用，加之最近忙于release-1.8的发布，所以暂时还没有review代码。*来自志愿者整理的flink

2021-12-07 15:28:02

赞同展开评论

问答分类：

消息中间件存储 Kafka 流计算实时计算 Flink版微服务引擎云消息队列 Kafka 版

问答标签：

实时计算 Flink版集群异常

问答地址：

开发者社区 > 微服务 > 问答

相关问答

有人知道，这个在任务提交到flink集群的时候怎么做么？

1097

3

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1209

4

0

flink1.15启动standalone模式集群，一直提示 UnsupportedFileSyst

308

1

0

flink checkpoint 保留机制问题集群模式是 standlane模式我设置参数sta

1089

1

0

flink cdc架包放集群的哪个目录下才能用啊

469

1

0

用sql方式同步的时候，sql有一些聚合操作用的是数据库的内存还是flink集群的内存？

990

0

0

我的yarn集群总是显示不了日志和跳转不到对应的flink或者spark监控页面，这是哪儿配置的呢

1407

1

0

flink cdc能运行在flink集群上吗？

540

0

0

Flink session 集群中我们怎么添加 lib下面的connector呢？

749

1

0

我们公司想在emr集群中自己安装flink，请问有没有知道文档link

626

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

当Supabase遇上RDS——如何高效构建轻量级应用？

万小智官网链接在哪？

阿里云服务器4核8G配置多少钱？一年、1个月或1小时收费明细

相关文章

南网商城 item_get 接口对接全攻略：从入门到精通

装机新手避坑指南：游戏CPU选购三大黄金法则+高性价比型号推荐

《理解MySQL数据库》B+树索引深度解析

HashiCorp Vault 镜像拉取与 Docker 部署全指南

QuickSSO 与 ECreator 实操应用案例手册

还有其他疑问?