• 服务器故障排查的前五分钟[转]

    遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手: 一、尽可能搞清楚问题的前因后果 不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体...
    文章 2016-04-07 2071浏览量
  • 如何将机器学习应用于预测性维护?

    这一概念包括预测部件何时出现故障,并有助于更好地预测部件或机器在其生命周期中的哪个阶段会出现故障。早期故障检测。在这种情况下,我们可以通过将传感器数据应用于机器学习算法,在故障发生之前检测出故障。最大...
    文章 2020-06-10 563浏览量
  • 高可用Redis服务架构分析与搭建

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2018-07-20 5561浏览量
  • PHP优化杂烩

    如果启用多个池,那么可以把请求分门别类放到不同的池中执行,此时如果某些请求出现拥堵之类的情况,那么只影响自己所在的池,从而控制故障的波及范围。listen 虽然 Nginx 和 PHP 可以部署在不同的服务器上,但是...
    文章 2017-05-02 885浏览量
  • PHP优化杂烩

    如果启用多个池,那么可以把请 求分门别类放到不同的池中执行,此时如果某些请求出现拥堵之类的情况,那么只影响自己所在的池,从而控制故障的波及范围。listen 虽然 Nginx 和 PHP 可以部署在不同的服务器上,但是...
    文章 2017-05-02 2358浏览量
  • 高可用Redis服务架构分析与搭建!

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2018-06-14 760浏览量
  • RAC集群简介(原创)

    要求在每个节点执行root.sh 脚本,这个脚本在/etc/inittab 文件的最后把这3个进程加入启动项,这样以后每次系统启动时,Clusterware 也自动启动,其中EVMD和CRSD 两个进程如果出现异常,则系统自动重启这两...
    文章 2016-05-24 1694浏览量
  • 架构篇:高可用 Redis 服务架构分析与搭建

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2020-04-26 682浏览量
  • 高可用 Redis 服务架构分析与搭建

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2018-10-07 1070浏览量
  • 高可用 Redis 服务架构分析与搭建

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2018-10-08 790浏览量
  • Linux 服务器故障排除的前五分钟(First 5 Minutes ...

    如果服务器上有好几个Java或者Erlang什么进程在同时运行,能够按PID分别找到每个进程就很重要了。通常我们建议每台服务器上运行的服务少一点,必要时可以增加服务器。如果你看到一台服务器上有三四十个监听端口开...
    文章 2017-11-07 1170浏览量
  • 高可用 Redis 服务架构分析与搭建

    为了实现高可用,解决方案1中所述的单点故障问题,我们必须增加一个备份服务,即在两台服务器上分别各启动一个Redis Server进程一般情况下由master提供服务,slave只负责同步和备份。与此同时,在额外启动一个...
    文章 2018-10-07 841浏览量
  • Linux系统的中断、系统调用和调度概述【转】

    中断一般分为三类:1、由计算机硬件异常或故障引起的中断,称为内部异常中断;2、由程序中执行了引起中断的指令而造成的中断,称为软中断(这也是和我们将要说明的系统调用相关的中断);3、由外部设备请求引起的...
    文章 2017-11-14 957浏览量
  • 分布式系统解决之道:目录、消息队列、事务系统及其他

    这个广播的底层一般会由消息队列服务来承载,而类似Jgroups这样的软件,直接提供了广播服务。虽然现在我们在讨论事务系统,但实际上分布式系统经常所需的“分布式锁”功能,也是这个系统可以同时完成的。所谓的...
    文章 2017-05-11 1622浏览量
  • 对系统故障处理的思考

    上面写的只是日常故障的基本处理思路和影响sql性能的一些可能点,随着系统运行的时间加长,还有其它的问题出现,还挖掘更多的隐患,只有那样才能触进系统更加健康良好的运行。本文转自 149banzhang 51CTO博客,...
    文章 2017-11-14 934浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    在磁盘进入SLOW或WARNING状态时,在线应用一般会选择不再使用此磁盘,因为此时磁盘可能已经出现损坏的迹象,会造成延时大规模增加,但对于理想的应用则可以继续使用。一旦磁盘进入ERROR状态,则表明此磁盘可能马上...
    文章 2016-12-18 4694浏览量
  • 触类旁通,从400错误看Nginx常见故障与修复

    但是为什么一样的客户端请求方式,旧配置完全ok,新配置则会出现大量400错误?节点2 至此,小明怀疑自己没有完全diff出新旧两份配置的差别,于是他使用vimdiff再次对比新旧两份配置。下面仅贴出关键配置: 旧配置: ...
    文章 2017-05-16 3730浏览量
  • Linux系统的中断、系统调用和调度概述【转】

    中断一般分为三类:1、由计算机硬件异常或故障引起的中断,称为内部异常中断;2、由程序中执行了引起中断的指令而造成的中断,称为软中断(这也是和我们将要说明的系统调用相关的中断);3、由外部设备请求引起的...
    文章 2016-08-07 834浏览量
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    系统改造验收:对于分布式系统,至少应该做到运行态中不会因为我依赖的系统出现故障,而引起当前应用出现可用性的问题,比如进程挂掉,频繁FullGC,负载飙高等,何时何地都具备快速止血的能力。限流降级参考:对于弱...
    文章 2017-06-19 3724浏览量
  • 《游戏设计师修炼之道:数据驱动的游戏设计》一2.3 ...

    会出现什么问题呢?它将会使系统更加复杂。跟GDI+API例子类似,更多的复杂性带来更多的故障。如果新功能对该产品的成功非常重要,那么从项目一开始,就应该重视系统中特定部分的安全性。至少,关键组件的可靠性和...
    文章 2017-08-01 1075浏览量
  • 利用AX产品提升DNS服务器可用性和安全性的一种有效...

    通常在服务器或网络层设备上启用IP anycast是无法做到应用层的健康监测的,只要网络层可达,IP anycast的OSPF路由就有效,这样就会出现当DNS进程或应用层出现问题时,依然会有DNS请求被分配到这些有问题的服务器上,...
    文章 2017-11-14 1100浏览量
  • [转载]Linux进程状态解析之R、S、D、T、Z、X

    通过ps命令我们看到,一般情况下,进程列表中的绝大多数进程都处于TASK_INTERRUPTIBLE状态(除非机器的负载很高)。毕竟CPU就这么一两个,进程动辄几十上百个,如果不是绝大多数进程都在睡眠,CPU又怎么响应得过来...
    文章 2018-04-18 8854浏览量
  • 负载均衡连载之五

    如果用windows的word之类的工具编辑这两个文件,上传到linux服务器时,会出现格式问题,而导致运行错误。当然,可以用dos2unix修正格式,或者在vi的命令模式下,以“:set ff=unix”方式转换格式。本文转自sery51CTO...
    文章 2017-11-08 883浏览量
  • 《深入理解Hadoop(原书第2版)》——2.3Hadoop系统的...

    如果此时其访问的数据节点出现故障,就访问存放备份数据块的数据节点。3)读取数据块的时候计算该数据块的校验和,并将该校验和与写入文件时的校验和作比较。如果检验失败,则从其他数据节点获取备份数据块。...
    文章 2017-05-02 1401浏览量
  • Redis(四):持久化之-AOF持久化的配置和原理

    信号处理函数会阻塞父进程对外提供读写操作(时间很短,不阻塞就又会出现数据不一致的情况),然后将AOF重写缓冲区的内容写入到新的AOF文件中,最后用新的AOF文件替换现有AOF文件(更名操作) APPENDFSYNC选项说明:...
    文章 2017-11-10 1053浏览量
  • JVM笔记8-虚拟机性能监控与故障处理工具

    假如在某个线程的两个synchronized块之间发生了一次线程切换,那就会出现线程A等线程B持有的Integer.valueOf(1),线程B又等待着被线程A持有的Integer.valueOf(2),结果大家都跑不下去。出现思索后,点击Jconsole线程...
    文章 2018-05-05 15838浏览量
  • Linux的中断和异常扫盲笔记

    对于执行程序来说,这种“中断”的发生完全是异步的,因为不知道什么时候发生。CPU对其的响应也完全是被动的,但是可以屏蔽掉。异步中断是指由其他硬件设备依照 CPU 时钟信号随机产生,即意味着中断能够在指令之间...
    文章 2016-05-27 2628浏览量
  • Shell Limits设置引发的事故

    业务人员反馈说在执行某个特定模块时间隙性报错(也就是在查询条件所查询的数据量不同时可能会出现这种问题)ORA-04030:在尝试分配 123416 字节(QERHJ hash-joi,kllcqas:kllsltba)时进程内存不足,其它模块SQL执行...
    文章 2017-05-02 1770浏览量
  • 莫斯科保卫战之PHP-502 Bad Gateway

    如果长时间没有得到处理的请求就会出现504 Gateway Time-out这个错误,而正在处理的很累的那几个php-cgi如果遇到了问题就会出现502 Bad gateway这个错误。fastcgi_read_timeout 300s;其实这个小报错是之前的小故障...
    文章 1970-01-01 1732浏览量
  • DBA必备技能:数据库挂起时进行转储分析诊断案例

    在上周末培训中,有同学...而通过这样的 DUMP 文件,辅助我们上一节提到的 ass109.awk 脚本,则可以很容易的同一般用户进行远程的诊断和故障处理,以下是一个朋友在系统出现 Hang 住挂起时转储的状态文件分析,通过分析...
    文章 2017-07-18 2117浏览量
1 2 3 4 ... 25 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化