kernel: httpd[6430]: segfault at* rsp * error 6-阿里云开发者社区

开发者社区> 科技小能手> 正文

kernel: httpd[6430]: segfault at* rsp * error 6

简介:
+关注继续查看

Aug 18 13:52:37 ad2 kernel: httpd[6430]: segfault at 000000004d88ad80 rip 00002b1e0fad870a rsp 000000004d88ad60 error 6
Aug 18 13:52:38 ad2 kernel: httpd[6535]: segfault at 00000000400e4d80 rip 00002b1e0fad870a rsp 00000000400e4d60 error 6
Aug 18 13:52:39 ad2 kernel: httpd[6564]: segfault at 0000000049c84d80 rip 00002b1e0fad870a rsp 0000000049c84d60 error 6
Aug 18 13:52:40 ad2 kernel: httpd[6765]: segfault at 0000000042478d80 rip 00002b1e0fad870a rsp 0000000042478d60 error 6
Aug 18 13:52:41 ad2 kernel: httpd[6880]: segfault at 0000000042e79d80 rip 00002b1e0fad870a rsp 0000000042e79d60 error 6
Aug 18 13:52:41 ad2 kernel: httpd[6890]: segfault at 0000000047e81d80 rip 00002b1e0fad870a rsp 0000000047e81d60 error 6
Aug 18 13:52:43 ad2 kernel: httpd[7101]: segfault at 0000000042478d80 rip 00002b1e0fad870a rsp 0000000042478d60 error 6
Aug 18 13:52:45 ad2 kernel: httpd[7237]: segfault at 0000000050a8fd80 rip 00002b1e0fad870a rsp 0000000050a8fd60 error 6
Aug 18 13:52:47 ad2 kernel: httpd[7347]: segfault at 0000000049283d80 rip 00002b1e0fad870a rsp 0000000049283d60 error 6
Aug 18 13:52:49 ad2 kernel: httpd[7455]: segfault at 000000004427bd80 rip 00002b1e0fad870a rsp 000000004427bd60 error 6
Aug 18 13:52:51 ad2 kernel: httpd[7602]: segfault at 0000000055a97d80 rip 00002b1e0fad870a rsp 0000000055a97d60 error 6
Aug 18 13:52:53 ad2 kernel: httpd[7717]: segfault at 0000000054695d80 rip 00002b1e0fad870a rsp 0000000054695d60 error 6
Aug 18 13:52:55 ad2 kernel: httpd[7812]: segfault at 000000004387ad80 rip 00002b1e0fad870a rsp 000000004387ad60 error 6
Aug 18 13:52:57 ad2 kernel: httpd[7932]: segfault at 000000004a685d80 rip 00002b1e0fad870a rsp 000000004a685d60 error 6
Aug 18 13:52:59 ad2 kernel: httpd[8072]: segfault at 000000005969dd80 rip 00002b1e0fad870a rsp 000000005969dd60 error 6
Aug 18 13:53:01 ad2 kernel: httpd[8160]: segfault at 000000004387ad80 rip 00002b1e0fad870a rsp 000000004387ad60 error 6
Aug 18 13:53:03 ad2 kernel: httpd[8292]: segfault at 000000004f68dd80 rip 00002b1e0fad870a rsp 000000004f68dd60 error 6
Aug 18 13:53:05 ad2 kernel: httpd[8413]: segfault at 000000004d88ad80 rip 00002b1e0fad870a rsp 000000004d88ad60 error 6
Aug 18 13:53:07 ad2 kernel: httpd[8514]: segfault at 000000004427bd80 rip 00002b1e0fad870a rsp 000000004427bd60 error 6
Aug 18 13:53:09 ad2 kernel: httpd[8645]: segfault at 0000000048882d80 rip 00002b1e0fad870a rsp 0000000048882d60 error 6
Aug 18 13:53:11 ad2 kernel: httpd[8765]: segfault at 0000000049283d80 rip 00002b1e0fad870a rsp 0000000049283d60 error 6

今天重启了下apache 就出现了这个错误,我郁闷了到处搜资料没有解决方法,对于我这种运维工程师还是有点难度的,关键百度和谷歌没有解决方法,只有内存访问过界这个说法:

这种信息一般都是由内存访问越界造成的,不管是用户态程序还是内核态程序访问越界都会出core, 并在系统日志里面输出一条这样的信息。这条信息的前面分别是访问越界的程序名,进程ID号,访问越界的地址以及当时进程堆栈地址等信息,比较有用的信息是 最后的error number.
在上面的例子中,error number是6, 转成二进制就是110, 即bit2=1, bit1=1, bit0=0, 按照上面的解释,我们可以得出这条信息是由于用户态程序读操作访问越界造成的。
error number是由三个字位组成的,从高到底分别为bit2 bit1和bit0,所以它的取值范围是0~7.
bit2: 值为1表示是用户态程序内存访问越界,值为0表示是内核态程序内存访问越界
bit1: 值为1表示是写操作导致内存访问越界,值为0表示是读操作导致内存访问越界
bit0: 值为1表示没有足够的权限访问非法地址的内容,值为0表示访问的非法地址根本没有对应的页面,也就是无效地址
根据segfault信息调试定位程序bug:
#include<stdio.h>int main(){ int *p; *p=12; return 1;}
1. gcc testseg.c -o testseg -g,运行./testseg查看dmesg信息如下:
testseg[26063]: segfault at 0000000000000000 rip 0000000000400470 rsp 0000007fbffff8a0 error 6
2. 运行addr2line -e testseg 0000000000400470,输出如下:
/home/xxx/xxx/c/testseg.c:5 [...]

***********************

内存不足不会引起段错误。段错误通常出现在访问了非法的地址后,非法地址分为3类:
1. 访问的地址没有对应的物理内存。这类错误主要出现在越界访问,例如栈越界。比如说当前进程的栈只有5个页和它对应,共20k大小(x86平台),你访问的地址超过了这个范围,就会发生segmentation fault。

2.对地址的操作与该地址的属性不符合。例如该地址对应的内存是只读的,如文本段,你却试图进行写操作。

3.低权限访问高权限地址。这类情况发生在用户进程试图访问内核空间。例如x86中,TASK_SIZE以上的地址为内核空间,当用户态进程试图访问这些地址时,segmentation fault。********************

 

这些解释只能提供一些线索.

我的环境先解释下 nginx前端反向代理 apache后端 WEB 8000端口

这台服务器跑了3个域名 。访问的时候nginx没有问题 是502错误 明显是apache的错误,然后我就查内核和apache错误日志 就是上面一堆的东西了。

我就尝试各种方法解决 既然是内存问题 以前好好的突然就坏了。我就怀疑是不是内存 不足 free 内存没问题。 是不是溢出呢 不清楚

 

第一个CPU 中断有点问题 ,但是确实不是CPU 的问题 内核报错就是内存的问题,strace,iostat我也检查的了IO 都没问题,万恶的问题来自哪呢?

重启了服务器 ,apache 重新编译了还是不行,后来我就无语了,继续想办法解决啊

0000000049283d80 这是进制转换过来的 转回去没工具,但是想了是应该是程序的问题,抱着侥幸的心里试了下。把这上面的域名全部注释了,自己新建了个一个虚拟主机写了个测试页面 居然好了。这个怎么个情况呢?然后我把3个域名一个个试。加上其中第2个域名就出现了内核报警这个情况,最后就找程序员 问最近上传什么程序了么,因为这个是新项目,改动的比较多,然后把那个几个目录给我 ,我全部移动出来 ,一个个移动回去测试那个目录里面的程序导致的,当然查询这个是有很快的方法的,最后排查锁定的一个目录啦,进入目录 查询时间 但是没有找到,然后看到一个s_s_s_ 这个一个文件,打开一看进制文件,我问程序员没用我就删除了,然后一切恢复正常了。

 

最后总结这个就是程序导致的情况最多,建议自己编个虚拟主机试试,如果不是我就不怎么清楚了,我是费了2小时解决的,一步步排查的,很纠结遇到这个问题,但不要着急 仔细分析办法总会有的。


本文转自 houzaicunsky 51CTO博客,原文链接:http://blog.51cto.com/hzcsky/642681


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10081 0
使用NAT网关轻松为单台云服务器设置多个公网IP
在应用中,有时会遇到用户询问如何使单台云服务器具备多个公网IP的问题。 具体如何操作呢,有了NAT网关这个也不是难题。
26789 0
阿里云服务器ECS远程登录用户名密码查询方法
阿里云服务器ECS远程连接登录输入用户名和密码,阿里云没有默认密码,如果购买时没设置需要先重置实例密码,Windows用户名是administrator,Linux账号是root,阿小云来详细说下阿里云服务器远程登录连接用户名和密码查询方法
11615 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13885 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
9160 0
阿里云服务器ECS登录用户名是什么?系统不同默认账号也不同
阿里云服务器Windows系统默认用户名administrator,Linux镜像服务器用户名root
4504 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7365 0
23706
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载