备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

各位大佬，flink任务的并发数调大到160+以后，每隔几十分钟就会出现一次TM节点连接丢失的异常，

各位大佬，flink任务的并发数调大到160+以后，每隔几十分钟就会出现一次TM节点连接丢失的异常，导致任务重启。并发在100时运行比较稳定，哪位大佬可以提供下排查的思路？本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。点击这里欢迎加入感兴趣的技术领域群。

展开

收起

黄一刀 2019-11-29 16:26:02 3855 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

好好学习天天向上

原因不确定，可能有的原因有：（1）内存用超了OOM挂掉了；（2）内存用多了被yarn的nodemanager给killed了，可以看看nodemanger的日志；（3）内存不太够，在做GC耗时较长卡住了，可以看看TM的gc日志；（4）网络抖动，可以尝试把timeout时间调长，taskmanager.network.netty.client.connectTimeoutSec=1800；（5）其他原因。

2020-03-06 21:06:00

赞同展开评论
黄二刀

建议先去看看失败了的那个TaskManager的日志，确定下根本的原因

2019-11-29 16:26:22

赞同展开评论

问答分类：

流计算开发者实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版连接实时计算 Flink版节点实时计算 Flink版异常实时计算 Flink版tm

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

怎么指定将任务发送到flink cdc集群的哪个节点？

149

1

0

给pgsql集群做flink cdc的用从节点ip连接刚开始正常,十几分钟报错怎么回事？

113

1

0

在Flink CDC中，难道从节点的slot是动态的隐藏了?

107

1

0

在Flink CDC中，从节点是只读权限用从节点连接cdc 但又能正常运行为什么呀？

95

0

0

在Flink CDC中一个job节点两个task节点，数量能设置为更多吗？

84

1

0

Apache Flink 中节点不持久化低水印有何影响？

90

1

0

Flink sink节点的SinkMaterialize怎么关闭

435

1

0

Flink维表Join时Join节点一直处于INITIALIZING状态

222

1

0

在Flink CDC中如何指定TM在某个节点上面执行？

67

0

0

Flink中节点busy的计算公式

221

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Chef：开源 AI 全栈应用构建工具实践

JSAR 粒子系统实战：打造炫酷 3D 烟花秀

Python 3.14 超详细下载安装教程，附安装包

软件测试入门到进阶：为什么你的代码需要被“挑刺”？

从零开始用 Electron 开发桌面客户端：打造你的第一个跨平台应用

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

debezium 可以正常读取做到数据同步，但是无法持久化表结构元数据

Flink-CDC 文档网站地址是什么？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

在Flink中Job Manager CPU设置为1，Memory设置为8G，它是算1CU还是什么？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

请问如何用flink sql客户端用yarn application模式提交任务呢？

flink比如，半小时内状态一直停留在13，我的语法匹配规则是不是有什么问题？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算StreamCompute

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

【对话科技】Flink技术介绍和新功能展望

Flink: 快速构建统一的实时日志平台

展开全部

还有其他疑问?