• 《CCNP TSHOOT 300-135学习指南》——1.1节故障检测与...

    所有的故障检测与排除方法都包括收集信息、分析信息、排除潜在故障原因、提出推断、验证推断等几个基本步骤,每个步骤都有其用意,需要...如何以及何时从一个步骤过渡到下一个步骤是成功进行故障检测与排除工作的关键...
    文章 2017-05-02 1755浏览量
  • 《VMware Virtual SAN权威指南(原书第2版)》一3.9 ...

    vSphere HA不将VSAN数据存储用于心跳也不允许用户把它指定为一个心跳数据存储,VSAN使用网络群集服务来取而代之,它允许非常快速的故障检测。主要的原因是VSAN通常和vSphere HA一样使用同一个网络接口并在切换时和...
    文章 2017-08-01 1537浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    故障检测方法数据错误 100%会发生,没有任何侥幸,故障的检测方法将极为重要,能够快速检测到数据错误,将能争取更多的机会修复数据。为了检测故障,业界提供了如下的典型校验码算法或纠错码算法:XOR 算法。按照...
    文章 2021-07-01 3060浏览量
  • 通过Windows Server 2012提高虚拟化环境下的高可用性

    但是这种高可用环境一般只能检测物理环境的故障,例如物理主机宕机等,并且恢复的操作方式是将故障物理主机上的虚拟机选择另外一台可用的集群物理节点启动,好一些的集群策略通常还会加入对选择启动节点的“资源尺寸...
    文章 2017-11-15 980浏览量
  • Nginx之Keepalived实现高可用(双机热备+自动切换)

    在 Keepalived服务正常工作时,主 Master节点会不断地向备节点发送(多播的方式)心跳消息,用以告诉备Backup节点自己还活着,当主 Master节点发生故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自主 ...
    文章 2020-04-30 1431浏览量
  • Nginx实战教程:生产环境之Nginx高可用方案...

    在 Keepalived服务正常工作时,主 Master节点会不断地向备节点发送(多播的方式)心跳消息,用以告诉备Backup节点自己还活着,当主 Master节点发生故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自主 ...
    文章 2020-04-29 978浏览量
  • 容灾切换必备-全局流量管理介绍

    当地址池中地址发生故障时HealthCheck模块会准确的检测到异常情况并与DNS交互,摘除故障地址。并当故障地址恢复时,自动恢复至解析返回列表。经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 5分钟内...
    文章 2020-04-13 1288浏览量
  • 130 秒揭秘 EDAS 3.0 如何平滑应对突发流量高峰,为您...

    带着这三个问题,我们来看看 EDAS3.0 的云原生架构是如何满足真实场景下的流控难题和单点故障引起的交易成功率下降的问题的,详情如视频所示: 戳这里、戳这里、戳这里视频,这里是视频哦~ 演示系统 视频中演示...
    文章 2020-10-12 5293浏览量
  • 无人值守时代,运维如何保障发布质量?

    无人值守发布的两大核心能力,一个是故障检测,一个是异常推荐。故障检测主要是发现现在的问题。异常推荐主要是防范于未然,是指发布出现了问题,但是不一定会引起故障,这些异常给开发的同学透明出来,需要开发注意...
    文章 2018-04-18 3821浏览量
  • redis系列:集群

    这篇文章主要介绍集群搭建和故障检测转移,当然集群中还有其他知识点像MOVED 重定向、ASK 重定向和重新分片等功能,这些功能官方文档都有相应的资料。Redis官网:https://redis.io Redis中文网:http://www.redis.cn...
    文章 2018-08-12 3078浏览量
  • 阿里:千亿交易背后的0故障发布

    无人值守发布的两大核心能力,一个是故障检测,一个是异常推荐。故障检测主要是发现现在的问题。异常推荐主要是防范于未然,是指发布出现了问题,但是不一定会引起故障,这些异常给开发的同学透明出来,需要开发注意...
    文章 2018-04-20 5080浏览量
  • SCVMM 2012 R2运维管理六之:SCVMM高可用部署

    OK、前面的实验为大姐介绍了如何配置ISCSI存储以及如何配置故障 转移集群,那么下面我们就来一下今天实验的重点-安装高可用的SCVMM。前面的博文中我们给大家介绍了安装SCVMM需要安装windows ADK以及当SCVMM和SQL...
    文章 2017-11-07 1312浏览量
  • 触类旁通,从400错误Nginx常见故障与修复

    因此,本文将从一个Nginx错误代码400引发的故障入手,谈谈如何分析和修复常见的Nginx异常。故障简述 小明某天中午在线优化一个敏感服务的Nginx配置时,发现5分钟内Nginx errorlog里出现了大量400错误,于是迅速回滚...
    文章 2017-05-16 3763浏览量
  • 《CCNP TSHOOT(642-832)学习指南》一1.3 网络维护...

    采集日志信息并将日志信息存储到服务器上或至少存储到路由器的独立内存中是非常有意义的,这将会给今后的故障检测与排除工作提供极大的帮助 将日志消息记录到路由器或交换机的缓存中是保证设备日志可用的最起码的...
    文章 2017-05-02 1390浏览量
  • 宽带路由器常见故障排除技巧

    在运行的过程中出现故障是在所难免的,虽然故障现象多种多样,引起故障发生的原因也不尽相同,但从大体上可以把这些故障分为硬件故障和软件故障,具体来说就是一些网络连接性问题、配置文件选项问题以及网络协议问题...
    文章 2017-11-27 896浏览量
  • 这些常见的网络故障,你都知道如何解决吗

    故障现象上来,连接至集线器的计算机既无法Ping通路由器,也无法Ping通其他计算机,初步断定应该是计算机至集线器之间的连接故障。此时可以先更换一根网线试试,如果依然无法排除故障,则可以更换集线器解决。...
    文章 2018-10-25 1439浏览量
  • LVS故障解决案例解析

    记上一篇LVS防火墙配置后,接下来想分享一篇LVS故障排错案例,仅供大家参考和学习,LVS使用过程中,我们都会遇到很多的问题,但是遇到问题后,我们需要该如何处理呢?那这里分享我的解决思路。LVS+Keepalived+Nginx...
    文章 2017-11-14 1313浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    这些关键的数据进入到MaxCompute进行数据挖掘,来预测某个对象下一个状态(故障)的发生概率,同时也会根据挖掘的结果来调整Checker的规则和参数,以提高故障检测的准确率。常见的场景 华佗目前已能够处理主流硬件和...
    文章 2016-12-18 4724浏览量
  • 网站不能访问的解决思路

    可以这样简单检测是不是浏览器的问题,采用替换的方法,换一个浏览器试一下看看能不能访问(当然这一步可能在最初就被试过了),但也不排除有这种情况,比如都是使用的是IE的内核,修改同一个安全配置都会对浏览器...
    文章 2017-11-15 1937浏览量
  • 负载均衡热备模式下服务器网卡的主备切换问题

    看看图二中主备切换时,服务器网卡是如何切换的。服务器双网卡绑定为主备模式,主备网卡的切换条件通常配置为链路检测,发现链路中断时,主备网卡自动切换。从服务器的角度,冗余链路的主备切换分两种,第一种,...
    文章 2017-11-22 1323浏览量
  • Linux下.NET Core项目Nginx+Keepalived高可用(主从...

    目录1.前言2.安装3.配置文件详解4....负载均衡策略8.加权轮询(round robin)策略剖析9.IP哈希(ip hash)策略剖析10.最少连接(least_conn)策略剖析11.随机(random)策略剖析12.URL哈希(url hash)策略剖析13....这里的检测...
    文章 2020-04-27 982浏览量
  • 如何在ASA防火墙上实现ipsec*

    如何在ASA防火墙上配置ipsec* ③防火墙与路由器配置ipsec*的区别 说明:在ASA防火墙配置ipsec*与路由器的差别不是很大,而且原理相同,就是个别命令不一样。一、ipsec*故障排查 1、show crypto isakmp sa命令 通过...
    文章 1970-01-01 906浏览量
  • Windows Server 2008 R2故障转移群集

    2.检测配置: 我们在SQLSVR节点服务器上创建群集,则此台节点服务器就是群集的所有者。是不是: 下面红框中的IP 就是群集的虚拟IP地址 查查看磁盘的控制权应该在SQVSVR节点上,如下图所示: 再到FileSVR上去...
    文章 2017-11-14 909浏览量
  • 清华裴丹分享AIOps落地路线图,智能运维如何落地...

    那么AIOps中“异常检测”到底如何落地呢?很简单,我们的方法论就是庖丁解牛。当你刚开始接触异常检测这一问题时,你看到的就是一头全牛。但是,当你深入了解了异常检测之后,你就会目无全牛。你看到的是它的经脉。...
    文章 2017-11-24 8836浏览量
  • 使用 smartmontools 查看硬盘的健康状态

    这时候你可能会想,“是的,smartctl起来是个不错的工具,但我更想知道如何避免手动运行的麻烦。如果能够以指定的间隔运行,同时又能通知我测试结果,那不是更好吗?好消息是,这个功能已经有了。是smartd发挥作用...
    文章 2017-05-02 1661浏览量
  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不...

    故障探测中,精准全面报警,鲜有误报漏报,没有人工配置成本,所有流程自动化学习。即使业务发生了巨大的变化,例如阿里的钉钉在这一年中的发展非常迅速,在三个月前业务量可能处于一个量级,三个月后就上升到另一个...
    文章 2018-05-30 12318浏览量
  • WSFC日志分析进阶篇

    可以看到clusterlog似乎与我们其他地方看到的log不太一样,到底应该如何去理解呢,我们以一个例子来 进程ID:资源所在的16位RHS进程ID 线程ID:资源16位RHS线程ID GMT时间:事件发生时的GMT时间,精确至毫秒级别,...
    文章 2017-11-12 972浏览量
  • WPAD原理介绍暨故障排查:ISA2006系列之三

    将Perth的浏览器配置为自动检测发现,在IE浏览器中依次点击 工具-Internet选项-连接-局域网设置,如下图所示,勾选“自动检测设置”。在Perth上打开浏览器访问一个网站,同时启用Ethereal抓包追踪,抓包结果如下...
    文章 2017-11-09 899浏览量
  • 云原生下,如何实现高可用的MySQL?

    ProxySQL 网关检测到各个 MySQL 实例的可读写配置变化,调整读写分离配置。通知切换结果(邮件、钉钉群机器人)。SlightShift MySQL 能做到秒级故障转移,5-10秒监测到主机故障,5-10秒 apply 差异 relay logs,然后...
    文章 2020-09-01 1499浏览量
  • VMware HA实战攻略之四VMware HA安装及配置

    HA 确保该容量总是可用的(在指定的故障切换容量限制内),以便重启所有受服务器故障影响的虚拟机(基于为虚拟机配置的资源预留)。o 不间断地监控容量利用率,并"预留"备用容量以便能够重启虚拟机。当未发生故障时...
    文章 2017-11-22 1235浏览量
1 2 3 4 ... 29 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化