java oom一例

简介:

这几天和同事一起分析的一个线上的java应用。

线上查询平台应用,主要原理是用户传入sql,经由查询平台通过jdbc连接hive做查询操作。

主要架构:user---->tengine---->java--->haproxy---->hiveserver2

线上用户反映查询异常,分析tengine的访问日志,发现部分响应的http code是499(和之前处理的resin accesslog问题一样),怀疑是后端不响应,导致用户访问时立即抛出异常,分析nginx的error log,可以看到有部分connection reset的记录,同时结合telnet测试,发现后端有confused的情况,即nginx到后端java应用存在问题。

对于java应用来说,一般分析两部分,线程和堆栈。

通过jstat查看堆栈信息,发现old区使用率为100%,怀疑程序出现内存泄露,手动通过jmap  -histo:live xxx 触发full gc,发现old区不能被正常gc掉。

jstat信息:

1
2
3
4
5
6
7
8
jstat -gcutil  1306  1000  1000
   S0     S1     E      O      P     YGC     YGCT    FGC    FGCT     GCT  
   0.00  100.00  100.00  100.00   27.34     109     7.757   1986  3495.015  3502.772
   0.00  100.00  100.00  100.00   27.34     109     7.757   1987  3497.272  3505.029
   0.00  100.00  100.00  100.00   27.34     109     7.757   1987  3497.272  3505.029
   0.00  100.00  100.00  100.00   27.34     109     7.757   1987  3497.272  3505.029
   0.00  100.00  100.00  100.00   27.34     109     7.757   1988  3499.993  3507.750
   0.00  100.00  100.00  100.00   27.34     109     7.757   1988  3499.993  3507.750

使用如下命令打印线程堆栈,并使用heap分析工具进行分析:

1
jmap -F -dump:format=b,file=dataview0805.prof  13036

存在泄露点,发现是数组导致:

wKioL1QF4HSSG2IOAASq86ZPWrQ228.jpg

分析数组的内容,与查询返回的结构关联:

wKioL1QF4IOish0zAAR9lLvTaZU541.jpg

查看代码,发现如下部分:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
while (rs.next()){
                                 linkedMap =  new  MyMap<String,String>(); //LinkedHashMap
                                 for ( int  i= 1 ;i<=columnCount;i++){
                                         columnName = rsData.getColumnName(i);
                                         if (columnName.contains( "." )){
                                                 columnName=columnName.split( "\\." )[ 1 ];
                                         }
                     rsString=rs.getString(i);
                     if (rsString== null ){
                         rsString= "(NULL)" ;
                     }
                     linkedMap.put(columnName+ "-" +i,rsString);
                                 }
                                 list.add((MyMap<String, String>) linkedMap);
                         }
                 }

该段代码用来对查询结果的每个字段的每个数据进行特殊处理,如果有1万条记录,每条记录100个字段的话,linkedMap就会产生100W的数据,进而OOM,解决方法就是在最后将linkedMap清空即可(即linkedMap=null),另外,将对象的初始化过程防止while循环里面对应用的执行效也有一定的影响。



本文转自菜菜光 51CTO博客,原文链接:http://blog.51cto.com/caiguangguang/1548085,如需转载请自行联系原作者

相关文章
|
8月前
|
SQL 存储 数据可视化
使用Java分析器优化代码性能,解决OOM问题
使用Java分析器优化代码性能,解决OOM问题
|
1天前
|
监控 网络协议 NoSQL
java线上排查OOM内存溢出
java线上排查OOM内存溢出
47 1
|
1天前
|
缓存 监控 架构师
阿里面试:Java开发中,应如何避免OOM
在Java开发中,OutOfMemoryError(OOM)错误一直是令开发者头疼的问题,也是Java面试中出现核心频率很高的问题。 那么我们究竟怎么样才能够有效正确的管理内存,日常开发中究竟要注意哪些核心技巧来避免OOM错误。 本文将带大家一起学习10个避免OOM的实用小技巧,让大家在工作中能够有的放矢,避免OOM错误的飞来横祸。
56 1
|
1天前
|
监控 Java Linux
java配置OOM时保存堆转储文件
java配置OOM时保存堆转储文件
72 0
|
1天前
|
缓存 架构师 算法
Java内存溢出如何解决,Java oom排查方法,解决办法
在Java开发过程中,有效的内存管理是保证应用程序稳定性和性能的关键。不正确的内存使用可能导致内存泄露甚至是致命的OutOfMemoryError(OOM)。
|
1天前
|
缓存 架构师 算法
Java内存溢出如何解决,Java oom排查方法,10个定位解决办法
在Java开发过程中,有效的内存管理是保证应用程序稳定性和性能的关键。不正确的内存使用可能导致内存泄露甚至是致命的OutOfMemoryError(OOM)。
|
10月前
|
消息中间件 缓存 监控
36-Java程序员的梦魇:OOM内存溢出!
作为一名Java程序员,平时在公司拼命加班、任劳任怨干活,好不容易熬夜开发完系统,测试完毕,Bug修复完毕,然后上线部署系统,系统开始正常运行,终于歇口气能好好放松下,喝杯Java压压惊了,But!上线后最害怕的事是什么?
98 0
|
10月前
|
Arthas Dubbo Oracle
Java虚拟机OOM解析
针对以Java主导的企业级应用开发,Java虚拟机是整个项目架构的灵魂所在。只有弄清楚其内存分配及垃圾回收机制才能够在项目建设活动过程中游刃而余,无论是基于当前流行的微服务体系(以Spring家族的 Spring Cloud或以Ali家族的Dubbo)or 即将(已经)流行的服务网格体系。
81 1
|
12月前
|
Arthas 运维 监控
Java - 手撸线上故障 OOM + CPU居高不下
Java - 手撸线上故障 OOM + CPU居高不下
108 0
|
Java
Java NIO为何导致堆外内存OOM了?
某天报警:某台机器部署的一个服务突然无法访问。谨记第一反应登录机器查看日志,因为服务挂掉,很可能因OOM。这个时候在机器的日志中发现了如下的一些信息
364 0