• Redis高可用哨兵机制及SpringBoot整合哨兵

    Redis高可用哨兵机制及SpringBoot整合哨兵前言:在前面讲到了Redis分片机制可实现内存数据的扩容来提高执行速率-Redis分片机制,可是Redis分片依旧有一些问题,如果redis分片的节点如果有一个服务器宕机,则直接影响...
    文章 2020-03-23 895浏览量
  • 我所理解的vMware 5.5之vSphere HA

    无法与Master进行通讯,为了避免误判,所以从vSphere5.0以后引入了存储心跳,当网络心跳异常时,会触发存储心跳的检测,以便更准确判断当前故障是由于网络原因还是Esxi主机宕机引起。4.隔离地址 有时我们的Esxi主机...
    文章 2017-11-12 1063浏览量
  • 带你读《存储漫谈Ceph原理与实践》第二章Ceph 架构2.3...

    我们先看一下PG状态机的主要事件定义&xff0c;见表2-2。表2-2 PG状态机 ActivatingPeering 已经完成&xff0c;PG 正在等待所有 PG 实例同步并固化 Peering 的结果&xff08;Info、log等&xff09;Active活跃态。PG ...
    文章 2021-10-18 83浏览量
  • WSFC基础知识奠基

    然后故障转移群集利用心跳检测机制检测节点存活状态,一旦检测到节点宕机,会通过查询群集数据库,来讲宕机节点承载的群集应用进行上线 同时故障转移群集也具备了完善的群集应用健康感知,节点健康状态感知,群集...
    文章 2017-11-12 1330浏览量
  • 极速同步如何保证反向同步数据一致性

    同时每个开启极速同步的共享会发送心跳包到消息主题,如果没有收到心跳包,有可能是消息主题/消息队列不可访问导致消息通路中断或者是网关宕机很长一段时间才恢复。MNS可以保证已经成功投递的消息至少会被消费一次...
    文章 2020-01-17 788浏览量
  • Redis夺命连环11问

    速度快的原因主要有几点:完全基于内存操作C语言实现,优化过的数据结构,基于几种基础的数据结构,redis做了大量的优化,性能极高使用单线程,无上下文的切换成本基于非阻塞的IO多路复用机制那为什么Redis6.0之后又...
    文章 2021-03-05 913浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4805浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 3068浏览量
  • 云时代如何实现企业IT智能诊断?...

    而此时可能服务器已经宕机,只能被迫宕机才能解决问题、恢复业务。随着云时代的到来,智能诊断则是针对传统监控的一场革命,表现在: 诊断范围对象扩大:不仅可以诊断传统IT环境,同时可以诊断多种云环境;不仅...
    文章 2019-04-12 1589浏览量
  • 学习Nagios(二):Nagios配置

    status_file变量用于定义nagios的状态文件,此文件用于保存nagios当前的状态、宕机信息等。它会在每次nagios重新启动的时候被清空删除。status_update_interval=10 该变量用于定义状态文件(即status.dat)的更新...
    文章 2016-05-12 1760浏览量
  • 烂泥:学习Nagios(二):Nagios配置

    status_file变量用于定义nagios的状态文件,此文件用于保存nagios当前的状态、宕机信息等。它会在每次nagios重新启动的时候被清空删除。status_update_interval=10 该变量用于定义状态文件(即status.dat)的更新...
    文章 2017-11-29 716浏览量
  • 阿里云容器Kubernetes监控(九)-Kubernetes事件离线...

    Reason:产生这个事件的原因。Message:事件的具体描述。其他信息 通过事件的机制,我们可以丰富Kuernetes在监控方面的维度和准确性,弥补其他监控方案的缺欠。kube-eventer v1.0.0的发布与开源 针对Kubernetes的事件...
    文章 2019-07-14 5143浏览量
  • 用ML提前预测磁盘故障、智能诊断部署,MSRA在云端将...

    宕机和重启的最主要原因之一&xff0c;而磁盘故障又是造成硬件故障的主要原因。在磁盘完全失效前&xff0c;虚拟机就会受到影响&xff0c;并且磁盘数据存储分布极端失衡&xff0c;磁盘健康状态也会受到邻近磁盘的影响&xff0c;针对...
    文章 2022-01-24 1浏览量
  • 甩掉运维黑锅,容灾部署如何破?

    3.低至1分钟的监控频率,相当于您的网站每3秒钟,就可以获得一次健康检测,最快可以宕机后3分钟内检测出故障,并通过全球负载均衡功能完成故障切换。4.为了防止误报警现象发生,我们将宕机判断阈值设置为50%,即50%...
    文章 2017-04-19 11974浏览量
  • 今天跟我一起来涨姿势,深入了解一下AWS S3访问控制...

    所谓可信,AWS给出的概念是,在指定年度内为对象提供 99.999999999%的持久性和高达 99.99%的可用性,换句话说就是任何存储于S3的数据基本不可能丢失,在一个年度内,不超过1小时(3153.6s)的宕机时间。AWS S3会有...
    文章 2017-09-13 3099浏览量
  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-02 2288浏览量
  • 数据库大数据处理-复制(SQLServer)

    我们可以假设每个节点都是在不同的地理位置,因此假如说节点A宕机,则可以直接将应用程序连接字符串重定向到其它节点,实现了高可用性。从图2中还可以看出,对于任一节点我们都可以进行读写操作,因此实现了负载均衡...
    文章 2018-02-01 2555浏览量
  • SQL Server中的高可用性(3)-复制

    我们可以假设每个节点都是在不同的地理位置,因此假如说节点A宕机,则可以直接将应用程序连接字符串重定向到其它节点,实现了高可用性。从图2中还可以看出,对于任一节点我们都可以进行读写操作,因此实现了负载均衡...
    文章 2017-12-21 1146浏览量
  • 《架构真经:互联网技术架构的设计》大道至简

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-19 3448浏览量
  • “拟态防御”:让黑客找不到破门之

    继10月美国网站大规模宕机后,当地时间11月27日欧洲最大电信运营商德国电信又遭受严重攻击,导致约90万路由器发生故障,连续两日断网。物联网时代,当所有的设备都变成智能化,都接入网络后,边界的概念将会进一步被...
    文章 2017-08-01 1376浏览量
  • 中国院士提"拟态防御":让黑客找不到破门之

    继10月美国网站大规模宕机后,当地时间11月27日欧洲最大电信运营商德国电信又遭受严重攻击,导致约90万路由器发生故障,连续两日断网。物联网时代,当所有的设备都变成智能化,都接入网络后,边界的概念将会进一步被...
    文章 2017-08-01 996浏览量
  • 纯干货|一篇讲透如何理解数据库并发控制

    事务只要提交了,它的结果就不能改变了,即使遇到系统宕机,重启后数据库的状态与宕机前一致,这就是事务的持久性。数据只要存储非易失存储介质,宕机就不会导致数据丢失。因此数据库可以采用以下方法来保证持久性:...
    文章 2020-04-24 839浏览量
  • 一篇讲透如何理解数据库并发控制(纯干货)

    事务只要提交了,它的结果就不能改变了,即使遇到系统宕机,重启后数据库的状态与宕机前一致,这就是事务的持久性。数据只要存储非易失存储介质,宕机就不会导致数据丢失。因此数据库可以采用以下方法来保证持久性:...
    文章 2020-04-09 1202浏览量
  • 计算产品和技术3.2虚拟云服务器(san三)

    使得虚拟机的性能逼近物理机的性能&xff0c;是虚拟机技术发展的主要趋势。好的性能不单单要靠高性能的虚拟机&xff0c;也要靠高性能的 Guest OS。云服务提供商之间的性能竞争正在成为全栈的竞争&xff0c;而保持Guest OS 高...
    文章 2021-10-13 34浏览量
  • Chaos带你快速上手混沌工程

    这是因为流量并没有切换到没有宕机的那台机器,同时 说明我们的系统并没有失败重试的能力,或者是一开始就没有设计,或者是没有生效。通过这次故障注入,我们发现了系统的缺陷。3.2 切换至应用高可用服务控制台,在...
    文章 2021-11-15 68浏览量
  • java-优化-代码中的优化(1)

    特别是String对象的使用中,出现字符串连接情况时应使用StringBuffer代替,由于系统不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理。因此生成过多的对象将会给程序的性能带来很大的影响。...
    文章 2016-08-02 1210浏览量
  • SQL Server数据库损坏、检测以及简单的修复办法

    使用REPAIR_ALLOW_DATA_LOSS需要将数据库设置为单用户模式,这意味着宕机时间。无论是哪种情况修复数据库,都要考虑是否满足SLA,如果出现了问题之后,发现无论用哪种方式都无法满足SLA的话,那只能检讨之前的准备...
    文章 2017-12-21 1441浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1876浏览量
  • 华为架构师8年经验谈:从单体架构到微服务的服务化...

    可靠性差:某个应用BUG,例如死循环、OOM等,会导致整个进程宕机,影响其它合设的应用 如何解决传统单体架构面临的挑战?解决对策:1、拆分 2、解耦 3、透明 4、独立 5、分层。拆分:对应用进行水平和垂直拆分,...
    文章 2017-05-02 2652浏览量
  • 小微企业阿里云最佳实践系列(四):云监控与 SLS ...

    案例一、云监控实时检测网站状态,宕机时第一时间响应和处理 1、控制台打开云监控,进入站点管理 2、点击右侧的新建监控任务 3、填写所监控的网址并设置监控频率,这里我们为了让监控更灵敏,设置 1分钟 4、设置报警...
    文章 2019-06-03 1735浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化