• (四):C++分布式实时应用框架——状态中心模块

    集群节点故障时,如何检测发现并及时进行处理,从而避免对集群运行产生影响。这些都是在分布式实时系统设计时需要考虑的功能性问题。更不用说,分布式环境下的数据一致性、二阶段提交、脑裂、集群选主等复杂的分布式...
    文章 2017-12-14 1209浏览量
  • 托管节点池助力用户构建稳定自愈的 Kubernetes 集群

    (一个节点的运维与一万个节点的运维在时间上与工作量上具有本质的区别,大规模的节点故障已完全超出了人肉运维的可控范围,保姆式的运维是人力资源的极大浪费,成本昂贵)。自动感知节点故障,相比于人肉运维具有更...
    文章 2021-02-02 3282浏览量
  • 图解故障服务器下线:关于阿里云MongoDB高可用的探秘

    接下来,自动检测系统(idc,天象系统)会对问题主机进行打标与故障原因筛查,并提供对应的解决方案,将记录置于数据库内,通过自动化运维系统对用户进行及时有效的通知。到达运维时间时,运维系统下发任务,再由...
    文章 2017-03-28 8260浏览量
  • CAP原理

    但是两个概念侧重点不同,可用性是保证系统中某些节点故障的情况下系统可用,而分区容错性是保证系统出现网络分区即某些节点相互通信失败的情况下,系统依然可用。3、CAP三者取舍CAP定理定义了这三个属性之间的相互...
    文章 2021-09-15 288浏览量
  • KubeNode:阿里巴巴云原生 容器基础设施运维实践

    在线业务的特点是对延迟和抖动非常敏感,单节点的抖动、夯机、宕机等故障都可能会影响某个用户在淘宝的下单付款,引发用户的吐槽和投诉,所以整体对稳定性的要求非常高,要求对单节点故障的处理有很高的及时性和有效...
    文章 2021-03-11 1421浏览量
  • 看完这篇Redis-Cluster,稳拿30W年薪大厂offer(下)

    节点故障等故障发现就是通过这种模式来实现&xff0c;分为主观下线和客观下线&xff1a;7.1.1 主观下线定义某节点认为另一节点不可用&xff0c;这仅代表一个节点对另一节点的判断&xff0c;不代表所有节点的认知。流程节点-1定时...
    文章 2021-12-21 47浏览量
  • 主机租用商详解服务器集群技术特点

    构建集群的一个最大的优点是集群具有高可用性,在服务出现故障时,服务器集群系统可以自动将服务从故障节点切换到另一个备用节点,从而提供不间断性服务,保证了业务的持续运行。2.可扩展性 随着业务量的加大,现有...
    文章 2017-10-10 1302浏览量
  • 这可能是史上最全 Redis 高可用解决方案总结

    缺点:故障恢复复杂,如果没有 RedisHA 系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其它从库节点去复制新主库节点,整个过程需要人为干预...
    文章 2018-09-29 3215浏览量
  • 这可能是史上最全 Redis 高可用解决方案总结

    故障恢复复杂,如果没有 RedisHA 系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其它从库节点去复制新主库节点,整个过程需要人为干预,比较...
    文章 2018-09-30 1738浏览量
  • 这可能是目前最全的Redis高可用技术解决方案总结

    故障恢复复杂,如果没有RedisHA系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其它从库节点去复制新主库节点,整个过程需要人为干预,比较...
    文章 2018-08-21 20787浏览量
  • 一次MongoDB故障的复盘

    考虑到该客户使用的是MongoDB复制集架构,并且第二个接口的query使用了SecondaryPreferred,由于此时我们无法连接到数据库查看指标也无法查看到客户处该mongodb集群的监控信息,根据已有信息初步判断故障原因可能为...
    文章 2018-11-01 1820浏览量
  • 史上最全Redis高可用技术解决方案大全

    1、故障恢复复杂,如果没有RedisHA系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其他从库节点去复制新主库节点,整个过程需要人为干预,比较...
    文章 2018-11-16 1806浏览量
  • WSFC 状态操作指南

    节点故障转移 1.节点宕机 2.其它节点检测注册表 挂载共享存储联机上线 3.节点恢复 4.故障回复群集角色 对于群集故障转移,这里特别要说的是故障回复,这是个老古董了,从2003时代就看到它,故障回复必须和首选所有者...
    文章 2017-11-12 1327浏览量
  • 某物流客户Elasticsearch集群性能优化案例

    存在4-5T的单个较大索引,该索引字段多达2000+,分片大小普遍60G+,最高达到130G+,是制约查询性能的一个较大瓶颈,另外集群在业务高峰期还会出现经常的fullgc,这是出现访问超时的直接原因。如图: ​ ...
    文章 2020-11-05 3478浏览量
  • Linux下集群技术应用概述

    双机互备的好处是节省了设备资源,两个应用的双机热备至少需要四台服务器,而双机互备仅需两台服务器即可完成高可用集群功能,但是双机互备也有自身的缺点:在某个节点故障切换后,另一个节点上就同时运行了两个应用...
    文章 2017-11-15 1330浏览量
  • 高可用失灵:交换机导致Oracle集群故障致机场停运

    正常情况下,Oracle的RAC多节点就是为了实现业务连续性和高可用,一个节点故障通常不会引起整个数据库不可用。但是在这次事故中,显然服务全部失去。网友透漏的消息称:可能是网络交换机故障引起的异常,最后更换了...
    文章 2017-07-17 2543浏览量
  • MySQL集群节点宕机,数据库脑裂!如何排障?

    例如上面故障中,因网络原因导致集群节点数从3个变为2个,这时就应该及时地关闭剩余2个节点中的一个节点,让业务只跑在单节点上,还能避免出现脑裂的情况。至少业务不会因此终断。否则剩余的两个节点很快也会被网络...
    文章 2017-05-15 3907浏览量
  • linux下集群技术介绍

    双机互备的好处是节省了设备资源,两个应用的双机热备至少需要四台服务 器,而双机互备仅需两台服务器即可完成高可用集群功能,但是双机互备也有自身的缺点:在某个节点故障切换后,另一个节点上就同时运行了两个...
    文章 2017-11-12 1282浏览量
  • 同程旅行基于 RocketMQ 高可用架构实践

    先将用户流量全部切到二中心流量回归双中心,并切到一中心​回顾​全局 Global 集群就近原则一主二从,写过半消息即及写入成功元数据系统 raft 选主broker 主节点故障,自动选主​MQ 平台治理​即使系统高性能、高...
    文章 2021-07-01 3374浏览量
  • 浅析单点故障以及云上高可用和容灾

    顾名思义,单个点发生的故障,扩展到云上的环境,指的就是单个节点发生的故障导致整个链路瘫痪。这里的节点可以是一台服务器,一个数据库,一台网络设备,乃至一个应用程序。打个简单的比方,一个加工厂流水线只有甲...
    文章 2017-09-27 5214浏览量
  • 基于权重的节点驱逐-Oracle RAC 12.2 新特性

    当一个节点发生故障或者发生脑裂,节点因网络等原因不能与其他节点互通时,很可能会在集群重新配置的过程中被驱逐出去。RAC 的重新配置包含两个层面,一个是集群层面的,在发生脑裂的时候一般是基于编号做节点驱逐;...
    文章 2018-04-17 3393浏览量
  • 详解 Kubernetes 的稳定性和可用性

    default/kubernetes svc 问题:一台 Master 节点故障时,default/kubernetes 这个服务不会像其他服务那样,去更新它的 endpoint,异常的 Master 节点 IP 仍然会保留在 endpoint 里面。这样许多通过 svc 方式来访问 ...
    文章 2018-12-14 1962浏览量
  • 100%兼容MongoDB 阿里云数据库MongoDB版公测

    而对于因误操作等原因产生的数据故障,一键式数据恢复功能能通过备份文件实例数据恢复至原实例,有效防范因误操作等原因业务数据造成不可逆的影响。数据库最担心的安全防护体系如何?在安全方面,阿里云数据库...
    文章 2015-12-21 3473浏览量
  • 记一次MongoDB故障排查的过程

    考虑到该客户使用的是MongoDB复制集架构,并且第二个接口的query使用了SecondaryPreferred,由于此时我们无法连接到数据库查看指标也无法查看到客户处该mongodb集群的监控信息,根据已有信息初步判断故障原因可能为...
    文章 2018-11-08 2323浏览量
  • 掌门教育微服务体系 Solar|阿里巴巴 Nacos 企业级落地...

    Nacos Eureka Sync 将心跳上报请求放入队列,以固定线程消费,一个同步业务服务节点处理的服务实例数超过一定的阈值会造成业务服务实例的心跳发送不及时,从而造成业务服务实例的意外丢失。Nacos Eureka Sync 节点宕...
    文章 2020-08-03 1626浏览量
  • 深度|蚂蚁金服自动化运维大规模 Kubernetes 集群的...

    当然,“元集群”也会部署 Node-Operator,用于“元集群”Worker 节点的上下线,“元集群”的 Worker 节点也是各个“业务集群”的 Master 节点。Kube-on-Kube-OperatorKube-on-Kube-Operator 用于 Watch Cluster CRD...
    文章 2019-08-03 1324浏览量
  • 掌门教育微服务体系 Solar|阿里巴巴 Nacos 企业级落地...

    Nacos Eureka Sync 将心跳上报请求放入队列,以固定线程消费,一个同步业务服务节点处理的服务实例数超过一定的阈值会造成业务服务实例的心跳发送不及时,从而造成业务服务实例的意外丢失。Nacos Eureka Sync 节点宕...
    文章 2020-08-03 622浏览量
  • Redis Cluster 高可用方案

    一、Redis Cluster Cluster介绍 ...双(多)M-S结构适用于用户间不存在或者存在较少的数据关联的业务模式,读写效率是单M-S的两(多)倍,但要求故障时单台服务器能够承担两个Mater Redis的资源需求。
    文章 2016-10-11 12819浏览量
  • 连续2周多次Hang,只因应用大量跨节点访问RAC数据库!

    五、故障原因分析1、检查点未完成导致数据库Hang的可能原因: 首先怀疑归档目录出现问题导致无法写入归档日志,采取以下措施进行排查: 归档目录空间足够,不存在空间问题。对归档目录进行dd操作,对目录进行touch...
    文章 2017-05-15 1872浏览量
  • 难以置信,MySQL也可以无损自由切换

    同时3节点可以容忍1个节点故障,5节点可以容忍2个节点故障。相比传统的主备集群为什么会有这么神奇的改变呢,下面我们对新的架构做详细的阐述,尤其在改进可用性方面做的创新。新的金融版架构要求至少有3个节点,...
    文章 2018-06-16 5285浏览量
1 2 3 4 ... 69 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化