备案控制台

开发者社区大数据文章正文

一次线上Flink 背压情况分析之重新认识java dump 文件

2023-12-29 229

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

简介： 一次线上Flink 背压情况分析之重新认识java dump 文件

1.背压情况

kafka 不消费，Flink端背压高，发送端情况满，可以看背压图以及看flink 任务 back pressure 是否high

2.解决问题

thread dump 分析

3.Thread dump 文件关键信息

可以看到对应的行数代码

分析可能出现异常原因：countDownLatch 没有为0

countDownLatch 使用：

4.java 异常分析

head dump：JVM 内存信息 jmap

Thread dump：线程信息 jstack

JVM Heap dump和Thread dump -

java程序性能分析之thread dump和heap dump

Flink 背压排查思路总结：

1.在监控图上找到有反压的最下游Task节点，去Job DAG图中找到该Task的直接下游，问题就出在这个Task（监控图位于RCP运维中心——流作业管理——监控，打开Grafana监控图）

2.在监控图的顶部，Task处选择该Task，过滤掉无关信息

3.查看接收端buffer总体利用率的图，观察各subtask之间是否平衡（都100%表示平衡，部分100%部分0%表示不平衡）

4.选择接收端buffer最高的subtask，找到它所在的container id（如一样高，随意选择一个）

5.去Flink UI打开Task Managers页面，找到这个container，点进去，再点Thread Dump

6.在Thread dump页面里搜索：英文引号+Task名称前缀，找到最后一个匹配的线程（只看线程名称中不包含EventThread、2181的，如"Flat Map (43/100)"）

6.如调用栈显示不全且不足够用于分析，获取完整的调用栈

文章标签：

实时计算 Flink版

流计算

Java

监控

容器

消息中间件

关键词：

Java分析

Java文件

实时计算 Flink版分析

Java flink

实时计算 Flink版文件

相关实践学习

基于Hologres轻松玩转一站式实时仓库

本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。

Linux入门到精通

本套课程是从入门开始的Linux学习课程，适合初学者阅读。由浅入深案例丰富，通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员，只要能够坚持把所有章节都学完，也一定会受益匪浅。

诸葛子房

目录

相关文章

刘大猫.

|

1月前

|

Java

java小工具util系列5：java文件相关操作工具，包括读取服务器路径下文件，删除文件及子文件，删除文件夹等方法

java小工具util系列5：java文件相关操作工具，包括读取服务器路径下文件，删除文件及子文件，删除文件夹等方法

刘大猫.

74 9 9

喜欢猪猪

|

1月前

|

监控 Java 应用服务中间件

高级java面试---spring.factories文件的解析源码API机制

【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性，极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理，并通过Java代码手写模拟Spring Boot的启动过程，特别是spring.factories文件的解析源码API机制。

喜欢猪猪

76 2 2

刘大猫.

|

17天前

|

Java

java实现从HDFS上下载文件及文件夹的功能，以流形式输出，便于用户自定义保存任何路径下

java实现从HDFS上下载文件及文件夹的功能，以流形式输出，便于用户自定义保存任何路径下

刘大猫.

80 34 34

蓝易云

|

2天前

|

缓存算法搜索推荐

Java中的算法优化与复杂度分析

在Java开发中，理解和优化算法的时间复杂度和空间复杂度是提升程序性能的关键。通过合理选择数据结构、避免重复计算、应用分治法等策略，可以显著提高算法效率。在实际开发中，应该根据具体需求和场景，选择合适的优化方法，从而编写出高效、可靠的代码。

蓝易云

15 6 6

小王老师呀

|

26天前

|

监控算法 Java

jvm-48-java 变更导致压测应用性能下降，如何分析定位原因？

【11月更文挑战第17天】当JVM相关变更导致压测应用性能下降时，可通过检查变更内容（如JVM参数、Java版本、代码变更）、收集性能监控数据（使用JVM监控工具、应用性能监控工具、系统资源监控）、分析垃圾回收情况（GC日志分析、内存泄漏检查）、分析线程和锁（线程状态分析、锁竞争分析）及分析代码执行路径（使用代码性能分析工具、代码审查）等步骤来定位和解决问题。

小王老师呀

38 6 6

喜欢猪猪

|

1月前

|

消息中间件存储 Java

RocketMQ文件刷盘机制深度解析与Java模拟实现

【11月更文挑战第22天】在现代分布式系统中，消息队列（Message Queue, MQ）作为一种重要的中间件，扮演着连接不同服务、实现异步通信和消息解耦的关键角色。Apache RocketMQ作为一款高性能的分布式消息中间件，广泛应用于实时数据流处理、日志流处理等场景。为了保证消息的可靠性，RocketMQ引入了一种称为“刷盘”的机制，将消息从内存写入到磁盘中，确保消息持久化。本文将从底层原理、业务场景、概念、功能点等方面深入解析RocketMQ的文件刷盘机制，并使用Java模拟实现类似的功能。

喜欢猪猪

42 3 3

六月的雨在钉钉

|

1月前

|

Java 测试技术 Maven

Maven clean 提示文件 java.io.IOException

在使用Maven进行项目打包时，遇到了`Failed to delete`错误，尝试手动删除目标文件也失败，提示`java.io.IOException`。经过分析，发现问题是由于`sys-info.log`文件被其他进程占用。解决方法是关闭IDEA和相关Java进程，清理隐藏的Java进程后重新尝试Maven clean操作。最终问题得以解决。总结：遇到此类问题时，可以通过任务管理器清理相关进程或重启电脑来解决。

六月的雨在钉钉

52 5 5

东方睿赢

|

1月前

|

存储缓存安全

在 Java 编程中，创建临时文件用于存储临时数据或进行临时操作非常常见

在 Java 编程中，创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式，详细探讨了它们的使用场景和注意事项，包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。

东方睿赢

96 2 2

人物我非-32022

|

1月前

|

消息中间件资源调度 Java

用Java实现samza转换成flink

【10月更文挑战第20天】

人物我非-32022

33 1 1

farha

|

存储消息中间件缓存

flink背压问题解决记录

flink做流表维表关联，每天TB级数据量

farha

692 0 0

热门文章

最新文章

Java volatile关键字：你真的懂了吗？

java小工具util系列2：字符串工具

Java爬虫：数据采集的强大工具

Java多线程并发编程：同步机制与实践应用

Java中的异常处理：从基础到高级

深入理解Java异常处理机制

Liunx部署java项目Tomcat、Redis、Mysql教程

Java爬虫：深入解析商品详情的利器

java实现从HDFS上下载文件及文件夹的功能，以流形式输出，便于用户自定义保存任何路径下

Java 异常处理：机制、策略与最佳实践

探索Flink动态CEP：杭州银行的实战案例

Flink CDC MySQL同步MySQL错误记录

Flink 2.0 存算分离状态存储 — ForSt DB

Flink 三种时间窗口、窗口处理函数使用及案例

Flink SQL Deduplication 去重以及如何获取最新状态操作

The Past, Present and Future of Apache Flink

【开发者评测】实时计算Flink场景实践和核心功能体验测评获奖名单公布！

Flink Forward Asia 2024 即将盛大开幕！

flink 向doris 数据库写入数据时出现背压如何排查？

场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析

相关课程

更多

Java面试疑难点解析 - 面试技巧及语言基础

Java面试疑难点解析 - Java Web开发

Java面试疑难点解析 - 系统架构及项目设计

Java编程入门

Java面向对象编程

Java高级编程

相关电子书

更多

Spring Cloud Alibaba - 重新定义 Java Cloud-Native

The Reactive Cloud Native Arch

JAVA开发手册1.5.0

相关实验场景

更多

基于Hologres+Flink搭建GitHub实时数据大屏

基于Flink+Tair搭建实时监控大屏

5分钟上手Flink MySQL连接器

使用Flink实时发现最热Github项目

阿里云平台上进行Java程序的编译与运行

使用Java面向对象编写网络通信程序应用

下一篇

DataWorks售前咨询