文档备案控制台

开发者社区问答正文

flink-windows-state

hi，all 最近在使用flink遇到了问题，问题描述如下: checkpoint失败，jm报tm心跳丢失，然后重新开启tm，不一会yarn上就先后开启了多个tm。数据量并不大，给的内存也足够，tm的内存都被沾满了，不管给多少运行到一定时间就会满，就会出现上述情况。正好跑了很多程序，有带windows 也有不带的，在这里发现了端倪，带windows的程序checkpoint的文件非常之大，给我的感觉是把窗口内的数据都加入到状态了。个人推测是state把窗口接收到的元素都落盘了。

windows的半小时一次，滚动，非滑动。 checkpoint是1分钟一次。有没有人遇到过这种情况？

ps: 最重要的问题是yarn又创建了tm，有人可以分享一下这块吗？感觉这是个定时炸弹，tm仍在运行，应该是假死状态，然后又在yarn上申请容器创建tm，感觉这样下去集群都会崩溃*来自志愿者整理的flink邮件归档

展开

收起

毛毛虫雨 2021-12-07 12:27:32 551 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

雪哥哥
Hi

这里涉及到的问题比较多。
1. 为什么心跳会超时？是因为Full GC么，如果是使用的FsStateBackend/MemoryStateBackend，这是比较好解释的，因为数据在JVM堆上。如果使用的是RocksDB，这里是解释不通的。
2. window确实是使用state来存储数据，如果认为自己的state太大的话，是不是因为使用不当呢？可以参考文档 [1] 进行调优
3. 仍在运行的TM里面在做什么呢，为什么没有被JM释放，需要检查相关孤儿TM的日志以及jstack查看进程操作判断。
[1] https://ci.apache.org/projects/flink/flink-docs-stable/dev/stream/operators/windows.html#useful-state-size-considerations*来自志愿者整理的flink
2021-12-07 15:46:06

赞同展开评论

问答分类：

实时计算 Flink版

问答标签：

实时计算 Flink版Windows

问答地址：

开发者社区 > 云计算 > 问答

相关问答

windows 版本安装Flink CDC1.16.2 版本 taskmanager 起不起来，是？

602

3

0

有什么办法让flink在windows运行？

728

3

0

Flink CDC我在windows上跑个任务做测试，这个大概会是什么问题呢？

201

2

0

在Flink CDC中B想使用某种方式从mac电脑连接windows电脑，这个怎么能实现？

163

1

0

Flink报错OVER windows' ordering in stream mode mu...

574

1

0

有什么办法让flink在windows运行，单机都行?

848

2

0

请教一下windows 编译 flink1.18有问题?

320

1

0

请问下，Flink CDC 中你们有什么ssh隧道工具吗，windows和linux的？

251

1

0

请问flink CDC中怎么获取jdk11的包啊 windows？

198

1

0

在机器学习PAI中提交机器是windows机器，运行机器指docker-flink，是这个意思吗？

269

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

QoderWork CN 非常喜欢用英文是什么原因呢，经常中文里夹杂着一大段英文

Qoder CN积分单独购买更贵的问题

Qoder CN IDE 如何登录Qoder自己的账号，而不是阿里云的啊？？？

电脑ide都关了，通义灵码和Qorder这俩搁这干嘛呢，阿里的开发者就这水平？内存管理就做成这？

Qoder CN Qwen3.7-Max积分扣除与宣传不一致

相关文章

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink Agents 0.3 Roadmap解读

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Skill即服务：用Agent安全玩转云上Flink

还有其他疑问?