[故障处理]nfs导致系统负载异常

简介: [故障处理]nfs导致系统负载异常

目录

情况

某台虚拟机服务器系统负载极高,但是cpu、内存、IO都正常。home目录下无法使用ls,也无法使用 df -h。

排查

top看cpu和内存,正常。

iotop看io,正常。

看/var/log/message和journalctl -xe的系统日志,得知nfs有问题。

原因

nfs服务端的服务器之前重启过,而nfs服务没有启动,导致客户端一直在找服务端。

解决

启动nfs服务端的相关服务。

相关文章
|
2月前
|
Prometheus Kubernetes 监控
在K8S中,如何排查与解决Pod频繁重启的问题?
在K8S中,如何排查与解决Pod频繁重启的问题?
|
5月前
|
监控 Java Linux
疯狂飙高!怎么排查CPU导致系统反应缓慢的问题?
疯狂飙高!怎么排查CPU导致系统反应缓慢的问题?
121 0
|
11月前
|
缓存 容灾 NoSQL
变形记---容灾恢复 ,异常崩溃引发服务器丢档或无法正常运行
最近我给M部门面试服务器主程序开发的职位,我只问他们的架构设计经验,我发现相当一部分5-12年“本应该有足够开发经验”的开发组长,或开发主程序缺乏设计,缺乏容错,缺乏创新,比如一些服务器宕机如何崩溃拉起恢复玩家数据,数据库的异步线程读写如何避免被其他线程写回呢,至少目前能听到合理方案的面试者的回答不多,这也是我想写这篇文章的出发点,以此来分享给大家, 不仅仅是为了应付面试,更是解决实际问题的一种思路。 如题,举例说明:游戏服务器(或者其他业务服务器)正常运行中出现了异常崩溃,可能是异常断电引发,可能是云服务商的软硬件问题引发,这种情况下,你们的服务器架构有没有做灾难恢复处理? 使得
|
监控 容灾 安全
系统总出故障怎么办?
系统总出故障怎么办?
103 0
|
SQL 移动开发 Java
Java应用CPU打满故障处理
java应用CPU故障处理,及后续操作建议
1994 0
Java应用CPU打满故障处理
|
监控 NoSQL 关系型数据库
系统负载LoadAverage
系统负载LoadAverage
2623 0
|
监控 容器 关系型数据库
可用性监控-先于用户知道应用挂了
背景:任何服务都避免不了出现以下问题,你的用户访问不了你的服务或者站点,用户偶尔碰到5xx,服务响应延迟比较慢,某台应用进程挂掉,导致访问时好时坏。问题在于,_你是否要等你的用户来告诉你,你的程序是问题了_。
1839 0