【原创】Erlang 之 erl_crash.dump 生成

简介:
-=-=-=-=- 我是<我是歌手   >的分隔线 -=-=-=-=-  

(以下为原文引用) 

      crashdump 对于 erlang 的系统来讲如同 core 对于 c/c++ 程序一样宝贵,对于系统问题的修复提供了最详细的资料。当然 erlang 很贴心了提供了网页版的 crashdump_view 帮助用户解读数据,使用方法如下:
crashdump_viewer:start().
      因为 crashdump 文本文件里面记录了大量系统相关的信息,这些信息对于分析系统的性能,状态,排除问题提供了不可替代的功能。所以很需要在系统正常运作的时候,得到 crashdump 文件。  
      除了坐等系统在发生问题时,自动产生 crashdump 以外,另外还有三种方法来手动产生 crashdump 。   方法如下:  
  • erlang:halt("abort").
  • 在 erlang shell 下输入 Ctrl+c + “大写的A”
  • kill -s SIGUSR1 [erlang_pid]

-=-=-=-=- 我是<我是歌手   >的分隔线 -=-=-=-=-  

(以下为实际验证) 


【实验一】  

某业务进程运行中  
[root@Betty upu]# ps aux|grep upu
root      2185  0.0  0.0  12908   796 ?        S    13:03   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      2186 12.3  1.1 507936 43688 pts/0    Ssl+ 13:03   0:00 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      2237  0.0  0.0 103252   848 pts/6    S+   13:03   0:00 grep upu
root      2525  0.0  0.0  10956   396 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
[root@Betty upu]#
通过 remsh 登录,再通过 Ctrl+c,a 退出  
[root@Betty upu]# ./bin/upu remote_console
Erlang/OTP 17 [erts-6.0] [source] [64-bit] [smp:4:4] [async-threads:10] [hipe] [kernel-poll:false]


Eshell V6.0  (abort with ^G)
(upu@Betty)1> 
(upu@Betty)1> 
(upu@Betty)1> 
BREAK: (a)bort (c)ontinue (p)roc info (i)nfo (l)oaded
       (v)ersion (k)ill (D)b-tables (d)istribution
a
[root@Betty upu]#
可以看到,上述操作对业务进程无影响(不产生影响的原因见后文)。  
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu
root      2185  0.0  0.0  12908   796 ?        S    13:03   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      2186  3.1  1.1 507348 43600 pts/0    Ssl+ 13:03   0:00 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      2328  0.0  0.0 103252   848 pts/6    S+   13:03   0:00 grep upu
root      2525  0.0  0.0  10956   404 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
[root@Betty upu]# 
[root@Betty upu]#
再次通过 remsh 登录,并执行 Ctrl+c,A  
[root@Betty upu]# ./bin/upu remote_console
Erlang/OTP 17 [erts-6.0] [source] [64-bit] [smp:4:4] [async-threads:10] [hipe] [kernel-poll:false] Eshell V6.0 (abort with ^G) (upu@Betty)1> BREAK: (a)bort (c)ontinue (p)roc info (i)nfo (l)oaded (v)ersion (k)ill (D)b-tables (d)istribution A Crash dump was written to: erl_crash.dump Crash dump requested by user已放弃 (core dumped) [root@Betty upu]#
可以看到,上述操作对 upu 进程同样无影响不产生影响的原因见后文,同时能够产生 erl_crash.dump 文件  
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu
root      2185  0.0  0.0  12908   796 ?        S    13:03   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      2186  0.6  1.1 507604 43864 pts/0    Ssl+ 13:03   0:00 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      2463  0.0  0.0 103252   848 pts/6    S+   13:05   0:00 grep upu
root      2525  0.0  0.0  10956   408 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
[root@Betty upu]#
[root@Betty upu]# ll
总用量 360
drwxr-xr-x  2 root root   4096 226 14:27 bin
drwxr-xr-x  2 root root   4096 31 16:53 data
-rw-r-----  1 root root 334226 34 13:05 erl_crash.dump
drwxr-xr-x  3 root root   4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root   4096 31 16:52 etc
drwxr-xr-x 12 root root   4096 226 14:27 lib
drwxr-xr-x  2 root root   4096 34 13:03 log
drwxr-xr-x  3 root root   4096 226 14:27 releases
drwxr-xr-x  2 root root   4096 226 14:28 system
[root@Betty upu]#
此时就可以基于该 erl_crash.dump 文件对 upu 进程的运行时状态进行分析了(此结论已被我自己证实存在问题)。  


【实验二】  

某业务进程运行中  
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu         
root      2185  0.0  0.0  12908   796 ?        S    13:03   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      2186  0.1  1.5 507936 58048 pts/0    Ssl+ 13:03   0:01 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      2525  0.0  0.0  10956   412 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      2928  0.0  0.0 103252   844 pts/6    S+   13:21   0:00 grep upu
[root@Betty upu]# 
[root@Betty upu]# ll
总用量 36
drwxr-xr-x  2 root root 4096 226 14:27 bin
drwxr-xr-x  2 root root 4096 31 16:53 data
drwxr-xr-x  3 root root 4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root 4096 31 16:52 etc
drwxr-xr-x 12 root root 4096 226 14:27 lib
drwxr-xr-x  2 root root 4096 34 13:03 log
drwxr-xr-x  3 root root 4096 226 14:27 releases
drwxr-xr-x  2 root root 4096 226 14:28 system
[root@Betty upu]#
通过 remsh 登录,并执行 erlang:halt("abort").  
[root@Betty upu]# 
[root@Betty upu]# ./bin/upu remote_console
Erlang/OTP 17 [erts-6.0] [source] [64-bit] [smp:4:4] [async-threads:10] [hipe] [kernel-poll:false]


Eshell V6.0  (abort with ^G)
(upu@Betty)1> 
(upu@Betty)1> erlang:halt("abort").
*** ERROR: Shell process terminated! (^G to start new job) ***


BREAK: (a)bort (c)ontinue (p)roc info (i)nfo (l)oaded
       (v)ersion (k)ill (D)b-tables (d)istribution


^C[root@Betty upu]# 
[root@Betty upu]#
退出后发现生成了 erl_crash.dump ,此文件大小比通过 Ctrl+c,A 生成的大大的原因见后文  
[root@Betty upu]# ll
总用量 1404
drwxr-xr-x  2 root root    4096 226 14:27 bin
drwxr-xr-x  2 root root    4096 31 16:53 data
-rw-r-----  1 root root 1400355 34 13:21 erl_crash.dump
drwxr-xr-x  3 root root    4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root    4096 31 16:52 etc
drwxr-xr-x 12 root root    4096 226 14:27 lib
drwxr-xr-x  2 root root    4096 34 13:03 log
drwxr-xr-x  3 root root    4096 226 14:27 releases
drwxr-xr-x  2 root root    4096 226 14:28 system
[root@Betty upu]#
可以看到,此时业务进程已经终止。  
[root@Betty upu]# ps aux|grep upu
root      2525  0.0  0.0  10956   416 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      3053  0.0  0.0 103252   848 pts/6    S+   13:24   0:00 grep upu
[root@Betty upu]#

【实验三】  

某业务进程运行中  
[root@Betty upu]# ./bin/upu start
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu
root      2525  0.0  0.0  10956   424 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      3365  0.0  0.0  12908   792 ?        S    13:27   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      3366 27.3  1.0 511852 38788 pts/0    Ssl+ 13:27   0:00 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      3415  0.0  0.0 103252   848 pts/6    S+   13:27   0:00 grep upu
[root@Betty upu]#
执行 kill 命令发送信号 SIGUSR1 到业务进程  
[root@Betty upu]# 
[root@Betty upu]# kill -s SIGUSR1 3366
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu     
root      2525  0.0  0.0  10956   424 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      3429  0.0  0.0 103252   848 pts/6    S+   13:28   0:00 grep upu
[root@Betty upu]# 
[root@Betty upu]# ll
总用量 1400
drwxr-xr-x  2 root root    4096 226 14:27 bin
drwxr-xr-x  2 root root    4096 31 16:53 data
-rw-r-----  1 root root 1395568 34 13:28 erl_crash.dump
drwxr-xr-x  3 root root    4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root    4096 31 16:52 etc
drwxr-xr-x 12 root root    4096 226 14:27 lib
drwxr-xr-x  2 root root    4096 34 13:03 log
drwxr-xr-x  3 root root    4096 226 14:27 releases
drwxr-xr-x  2 root root    4096 226 14:28 system
可以看到,这种方式也能够产生 erl_crash.dump 文件,但业务进程会终止运行。  


【实验四】  

某业务进程运行中  
[root@Betty upu]# ./bin/upu start     
[root@Betty upu]# 
[root@Betty upu]# 
[root@Betty upu]# ps aux|grep upu
root      2525  0.0  0.0  10956   428 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      3645  0.0  0.0  12908   792 ?        S    13:31   0:00 /opt/mcu/upu/erts-6.0/bin/run_erl -daemon /tmp//opt/mcu/upu/ /opt/mcu/upu/log exec /opt/mcu/upu/bin/upu console '' 
root      3646 43.5  1.1 512108 42036 pts/0    Ssl+ 13:31   0:00 /opt/mcu/upu/erts-6.0/bin/beam.smp -K true -- -root /opt/mcu/upu -progname upu -- -home /root -- -boot /opt/mcu/upu/releases/1/upu -mode embedded -config /opt/mcu/upu/etc/upu.config -mnesia dir '/opt/mcu/upu/data' -sname upu@Betty -setcookie upu -- console 
root      3693  0.0  0.0 103252   848 pts/6    S+   13:31   0:00 grep upu
[root@Betty upu]# 
[root@Betty upu]# ll
总用量 36
drwxr-xr-x  2 root root 4096 226 14:27 bin
drwxr-xr-x  2 root root 4096 31 16:53 data
drwxr-xr-x  3 root root 4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root 4096 31 16:52 etc
drwxr-xr-x 12 root root 4096 226 14:27 lib
drwxr-xr-x  2 root root 4096 34 13:03 log
drwxr-xr-x  3 root root 4096 226 14:27 releases
drwxr-xr-x  2 root root 4096 226 14:28 system
[root@Betty upu]#
执行 kill 命令发送信号 SIGUSR2 到业务进程  
[root@Betty upu]#
[root@Betty upu]# kill -s SIGUSR2 3646
[root@Betty upu]# ll
总用量 36
drwxr-xr-x  2 root root 4096 226 14:27 bin
drwxr-xr-x  2 root root 4096 31 16:53 data
drwxr-xr-x  3 root root 4096 226 14:27 erts-6.0
drwxr-xr-x  2 root root 4096 31 16:52 etc
drwxr-xr-x 12 root root 4096 226 14:27 lib
drwxr-xr-x  2 root root 4096 34 13:03 log
drwxr-xr-x  3 root root 4096 226 14:27 releases
drwxr-xr-x  2 root root 4096 226 14:28 system
[root@Betty upu]# ps aux|grep upu
root      2525  0.0  0.0  10956   428 ?        S    Feb01   0:12 /opt/mcu/upucore/erts-6.0/bin/epmd -daemon
root      3706  0.0  0.0 103252   844 pts/6    S+   13:31   0:00 grep upu
[root@Betty upu]#
可以看到,这种方式不会产生 erl_crash.dump 文件,但 upu 进程会终止运行。  


结论:   只有通过 Ctrl+c,A 生成 erl_crash.dump 文件才无破坏性;  

相关文章:《   【原创】Erlang 之 erl_crash.dump 文件分析    


==============

重要的补充说明:

  • 上文的一些结论是存在问题的,已经进行了标注;
  • 问题在于上述试验中,我们是通过 remsh 机制登录到目标节点上的,即在本地创建一个 Erlang 节点,但在远端启动的初始 shell ,那么此时无论是使用 Ctrl+c,Ctrl+c,或 Ctrl+c,a ,还是 Ctrl+c,A ,终止的都是之前创建的那个初始 shell 。所以才不会导致目标进程的退出,但与此同时,即使获取到了 erl_crash.dump 文件,也不是目标进程对应的崩溃文件;
  • 通过 remsh 登录,再执行 erlang:halt("abort"). 则是令目标进程(ERTS)暴力退出,并以 "abort" 字符串作为 Slogan 生成 erl_crash.dump 文件。此时生成的崩溃文件必然比之前生成的大;
  • 通过 SIGUSR1 令目标进程退出,并生成 erl_crash.dump 文件的方式也是可以的。

结论:  
  1. Ctrl+c,Ctrl+c 和 Ctrl+c,a 什么都不会生成,即使是在 console 上执行;
  2. Ctrl+c,A 可以生成 erl_crash.dump 和 core.xxx (要放开 ulimit -c)
  3. erlang:halt("abort"). 只会生成 erl_crash.dump (即使放开 unlimit -c);
  4. erlang:halt(abort). 只会生成 core.xxx (要放开 unlimit -c)
  5. 通过 SIGUSR1 终止 erlang 进程,可以生成 erl_crash.dump 和 core.xxx (要放开 ulimit -c)
目录
相关文章
|
Perl 网络协议 消息中间件
都8102年了,还用fastq-dump,快换fasterq-dump吧
之前写过一篇文章Fastq-dump: 一个神奇的软件, 详细介绍了fastq-dump的用法。 虽然fastq-dump参数很多,而且一直被吐槽参数说明写的太差,但是如果真的要用起来其实也就是一行代码 fastq-dump --gzip --split-3 --defline-qual &#39;+&#39; --defline-seq &#39;@$ac-$si/$ri&#39; SRRXXXXX| SRRXXXX.sra # 加上--gzip后需要时间进行文件压缩 当然除了参数问题,还有一个让人诟病的地方就是他只能单个线程,所以速度特别的慢。
4853 0
都8102年了,还用fastq-dump,快换fasterq-dump吧
|
缓存 Android开发
一个 Crash 引发的血案
看起来很普通的一个 crash,报在手淘首页启动的瞬间,但是后续引发了一个很奇怪的问题,这篇文章就对这个问题的记录做一个详细记录。
一个 Crash 引发的血案
|
关系型数据库 MySQL
MySQL 的 crash-safe 原理解析
MySQL作为当下最流行的开源关系型数据库,有一个很关键和基本的能力,就是必须能够保证数据不会丢。那么在这个能力背后,MySQL是如何设计才能保证不管在什么时间奔溃,恢复后都能保证数据不会丢呢?有哪些关键技术支撑了这个能力?本文将为我们一一揭晓。
986 0
|
Linux C语言 Shell
centos7使用lldb调试netcore应用转储dump文件
centos7下安装lldb,dotnet netcore 进程生成转储文件,并使用lldb进行分析 随着netcore应用在linux上部署的应用越来越多,碰到cpu 100%,内存暴涨的情况也一直偶有发生,在windows平台下进程管理器右键转储,下载到本地使用windbg或者直接vs分析都比较方便。
1611 0
|
数据库 关系型数据库 Oracle
|
安全 关系型数据库 MySQL
myrocks crash safe特性
myrocks crash safe 特性
3911 0