使用单进程、strace、gdb调试PHP错误
PHP一般是在FPM的呵护下运行的,但是某些情况下进程异常崩溃会导致502。下面是解决思想:
1. 单进程运行:
php -d display_errors=1 -S 0.0.0.0:88 #然后访问,会直接显示fatal or error的信息
2. 以上不能解决,则采用strace
strace -d -f -ff -o trace.log -p FPM_ID
#或者:
strace -d -p FPM_ID
3. 如果还没解决问题,就得运用gdb (gnu's debug), 举个粟子:
最近在灰度测试PHP7的过程中,php-fpm出现间歇性的段错误。系统的错误信息如下:
php-fpm[7664]: segfault at 7f6ff4600000 ip 00007f6ff782176f sp 00007fff2e9c2fe8 error 4 in libc-2.12.so[7f6ff7798000+18a000]
为了排查出错的原因,我们接下来需要进行调试。由于错误间歇性出现在php-fpm处理请求的过程中,因此,我们需要获取获取Linux的core dumps文件。
打开Linux的core dumps
一般情况下,Linux默认core dumps是关闭状态。我们可以将其打开并且重定向到我们指定的文件。
$ echo '/tmp/coredump-%e.%p' > /proc/sys/kernel/core_pattern
core dumps文件支持变量:
%% a single % character
%c core file size soft resource limit of crashing process (since
Linux 2.6.24)
%d dump mode—same as value returned by prctl(2) PR_GET_DUMPABLE (since Linux 3.7) %e executable filename (without path prefix) %E pathname of executable, with slashes ('/') replaced by exclamation marks ('!') (since Linux 3.0). %g (numeric) real GID of dumped process %h hostname (same as nodename returned by uname(2)) %p PID of dumped process, as seen in the PID namespace in which the process resides %P PID of dumped process, as seen in the initial PID namespace (since Linux 3.12) %s number of signal causing dump %t time of dump, expressed as seconds since the Epoch, 1970-01-01 00:00:00 +0000 (UTC) %u (numeric) real UID of dumped process
这个例子中,我们把错误文件重定向到/tmp
目录下。
配置php-fpm支持core dumps
为了让php-fpm支持core dumps,我们需要打开php-fpm连接池的rlimit_core
配置,在配置文件中设置。
rlimit_core = unlimited
重启php-fpm进程,当SIGSEGV
信号量产生时,将会在你指定的core dumps目录产生指定的文件:
$ ls /tmp/coredump*
-rw------- 1 user group 220M /tmp/coredump-php-fpm.2393
使用gdb读取core dumps文件
首先,确认你的机器中正确安装了gdb调试工具(yum install gdb
)。然后,你将使用gdb $program-path $coredump-path
这样的命令格式调试。由于我们的程序运行在php-fpm,我们将使用以下的命令调试:
$ gdb /usr/local/services/php7/sbin/php-fpm core.6054
GNU gdb (GDB) Red Hat Enterprise Linux (7.2-60.el6_4.1) Copyright (C) 2010 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <http://g ... Core was generated by `php-fpm: pool www '. Program terminated with signal 11, Segmentation fault. #0 0x00007f54017dc76f in memcpy () from /lib64/libc.so.6 ... (gdb) bt #0 0x00007f54017dc76f in memcpy () from /lib64/libc.so.6 #1 0x00007f53fdf96443 in zend_string_init (execute_data=0x7f53fe416fc0) at /usr/local/services/php7/include/php/Zend/zend_string.h:159 #2 hp_execute_ex (execute_data=0x7f53fe416fc0) at /usr/local/src/xhprof-php7/extension/xhprof.c:1476 #3 0x00000000008c28b0 in ZEND_DO_FCALL_SPEC_HANDLER () at /data/software/php-7.0.6/Zend/zend_vm_execute.h:800 #4 0x00000000008851cb in execute_ex (ex=Unhandled dwarf expression opcode 0xf3 ) at /data/software/php-7.0.6/Zend/zend_vm_execute.h:414
bt
命令将会显示core dumps文件的调用栈。到此为止,我们定位到问题出现在/usr/local/src/xhprof-php7/extension/xhprof.c
文件在调用memcpy()
方法时,出现内存段错误。
结语
目前PHP7官方并未支持xhprof
扩展,为了分析性能,我们安装了第三方编译过的版本。将该扩展从灰度环境中下线,段错误问题就不再出现了。