could't create native thread的问题跟踪-阿里云开发者社区

could't create native thread的问题跟踪

2017-11-09 1290

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一、问题描述

之前因为java.lang.OutOfMemoryError: unable to create new native thread设置了Xss参数，见http://zouqingyun.blog.51cto.com/782246/1879975
nodeManager仍然出现该异常，同时map-reduce的任务中也出现该异常

二、一些现象

跑了一个map-reduce任务，这个任务处理的都是小文件，最后生成了2万多个map任务。这个job中许多任务出现java.lang.OutOfMemoryError: unable to create new native thread，观察了这个job的一些任务，发现这个任务的thread stack持续增长，最后有7000多个thread，最后导致java.lang.OutOfMemoryError: unable to create new native thread，因为每个map任务分配的内存为800m，ThreadStackSize是默认值1024k，最后导致内存耗尽。任务的线程栈中持续一下输出：

 
         "Thread-3689" 
         daemon prio=10 tid=0x00007fb6bf364000 nid=0x2331 
         in 
         Object.wait() [0x00007fb5b9b94000] 
        
         java.lang.Thread.State: TIMED_WAITING (on object monitor) 
        
         at java.lang.Object.wait(Native Method) 
        
         at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:638) 
        
         - locked <0x00000000f89800d0> (a java.util.LinkedList) 
        
         "Thread-3688" 
         daemon prio=10 tid=0x00007fb6bf362000 nid=0x10a9 
         in 
         Object.wait() [0x00007fb5b9c95000] 
        
         java.lang.Thread.State: TIMED_WAITING (on object monitor) 
        
         at java.lang.Object.wait(Native Method) 
        
         at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:638) 
        
         - locked <0x00000000f89701c0> (a java.util.LinkedList) 
        
         "Thread-3687" 
         daemon prio=10 tid=0x00007fb6bf35a800 nid=0xf23 
         in 
         Object.wait() [0x00007fb5b9d96000] 
        
         java.lang.Thread.State: TIMED_WAITING (on object monitor) 
        
         at java.lang.Object.wait(Native Method) 
        
         at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:638) 
        
         - locked <0x00000000f89681c0> (a java.util.LinkedList) 
        
         "Thread-3686" 
         daemon prio=10 tid=0x00007fb6bf358800 nid=0xde9 
         in 
         Object.wait() [0x00007fb5b9e97000] 
        
         java.lang.Thread.State: TIMED_WAITING (on object monitor) 
        
         at java.lang.Object.wait(Native Method) 
        
         at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:638)

三、猜测

1、nodemanager的异常可能与这个有关，当该map-reduce所有任务调度到一台机器（大概40个container），每个container中任务都生成7000个thread(生成很多小文件？)。导致耗尽max user processes（262144）。但nodemanger需要new thread的时候，出现java.lang.OutOfMemoryError: unable to create new native thread。（ps 昨天这个任务确实在定时跑）

2、可能是hadoop/yarn某些地方的内存溢出问题。参见一个类似的问题。https://issues.apache.org/jira/browse/YARN-4581

四、后记

hadoop处理大量小文件，要使用org.apache.hadoop.mapreduce.lib.input.CombineTextInputFormat，并设置mapreduce.input.fileinputformat.split.maxsize = 5147483648

本文转自 zouqingyun 51CTO博客，原文链接：http://blog.51cto.com/zouqingyun/1879976，如需转载请自行联系原作者

could't create native thread的问题跟踪

一、问题描述

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

could't create native thread的问题跟踪

一、问题描述

热门文章

最新文章

相关电子书