• Redis开发运维实践高可用和集群架构与实践(四)

    此时集群读写正常,在一个sentinel宕机的基础上宕master后切换正常。11.1.4.7 双sentinel宕测试 恢复集群状态,2.128为主,2.129、2.130为从。此时,将2.128的sentinel和2.129的sentinel都宕掉。此时主从集群读写均...
    文章 2017-05-08 2154浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-11 2214浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-17 4489浏览量
  • 热备方案及双热备软件选择

    如果运行着关键业务信息系统的服务器发生宕机或是因为不可控的原因而停止,从而导致整个企事业机构的信息运营系统瘫痪,将会给企事业机构带来巨大的经济损失,而由于企事业机构的业务不能正常运行也会影响企事业机构...
    文章 2017-08-09 4152浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    同步节点宕机故障转移: 节点监听:监听其它节点存活状态,配置 Etcd 集群租约 TTL,TTL 内至少发送 5 个续约心跳以保证一旦出现网络波动避免造成节点丢失;节点宕机:其中某个节点宕机,其任务转移到其它节点,因为...
    文章 2020-09-10 767浏览量
  • 独家支持用户自建、混合云环境集群,快收下这份HBase...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-12-17 773浏览量
  • 第九章:Redis replication 主从复制

    当master宕机的复制安全 在使用Redis复制的设置中,强烈建议在主服务器和从服务器中启用持久性。如果这种情况不可行,例如由于磁盘速度非常慢导致的延迟问题,则应配置实例以避免重新启动后自动重新启动。为了更好地...
    文章 2018-01-31 819浏览量
  • Apache Flink 在快手的过去、现在和未来

    宕机快速发现方面,我们研发了 Hawk Service,它是一个多数派的连通性检测服务,具体的检测流程是 Hawk 集群中多个工作节点会周期性地检测集群中每台机器的连通性,由于它是多数派的,所以可信度是有保障的。...
    文章 2021-02-26 1078浏览量
  • 避免在云迁移过程中宕机

    在公共云迁移期间,IT团队需要采取谨慎的步骤,以避免听到“系统宕机”这种可怕的提示。随着组织迁移到基于云计算的基础设施,IT团队需要在迁移过程中保持可用性。但是,考虑到所有复杂性,在云计算迁移过程中,防止...
    文章 2017-07-11 739浏览量
  • 阿里HBase超详实践总结|一文读懂大数据时代的结构化...

    所以,这些资源的链路解耦成为我们的工作,同时,也好好对数据复制的宕机恢复速度进行了优化。数据的一致性今天,大多数生产系统会使用异步方式去实现集群间的数据复制,因为这样效率更高、逻辑更清晰。这意味着,...
    文章 2017-06-20 4586浏览量
  • 避免在云迁移过程中宕机

    在公共云迁移期间,IT团队需要采取谨慎的步骤,以避免听到“系统宕机”这种可怕的提示。随着组织迁移到基于云计算的基础设施,IT团队需要在迁移过程中保持可用性。但是,考虑到所有复杂性,在云计算迁移过程中,防止...
    文章 2017-08-02 1263浏览量
  • 大数据时代的结构化存储—HBase在阿里的应用实践

    所以,这些资源的链路解耦成为我们的工作,同时,也好好对数据复制的宕机恢复速度进行了优化。数据的一致性 今天,大多数生产系统会使用异步方式去实现集群间的数据复制,因为这样效率更高、逻辑更清晰。这意味着,...
    文章 2017-02-21 10599浏览量
  • 蚂蚁智能监控

    容灾架构 前文简要提及了架构去单点问题的解决思路,这足以覆盖日常可能发生的节点宕机、网络抖动等小规模故障场景,但是当真正的毁灭性灾难来临时,还需要更高层面的容灾方案来应对。目前基于不同租户保障等级的...
    文章 2021-09-07 67浏览量
  • 浅析单点故障以及云上高可用和容灾

    负载均衡的服务提供是基于集群部署的,各集群有一定数量的节点,避免了单点故障,个别或者部分节点服务器宕机不会影响负载均衡服务的提供。当前提供的负载均衡实例大多是多可用区实例,主备实例在同城不同可用区机房...
    文章 2017-09-27 4874浏览量
  • 万字长文剖析AliSQL X-Cluster|基于X-Paxos的高性能...

    当Group内某个一致性节点发生意外状况(宕机或者网络隔离)集群会根据Group的配置,将挂载在故障节点下的只读节点配置到Group中另外一个正常工作的节点下进行数据同步。高性能日志 MySQL系统在开启主备复制的情况下...
    文章 2017-08-10 6033浏览量
  • 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1014浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1487浏览量
  • 订单同步有技巧,双十一高峰不再怕

    分组隔离+双机房容灾:数据推送客户端采用了分组隔离的方式,为每一个分组至少分配两台以上的机器,并且分到不同的机房,即使其中一个机房宕机了,也不会影响数据的正常推送,并且隔离各应用之间的影响;中间表+大字...
    文章 2016-09-23 13214浏览量
  • 探索ORACLE之11g DataGuard_01概念

    可以实现数据的零丢失,维护的零停机,保证业务的持续在线运行,通过读写分离有效的分担数据库压力,降低由于各种原因宕机的风险。4、DataGuard的体系架构 5、DataGuard 是否安全 DataGuard的同步是通过redo传输并且...
    文章 2013-08-13 1040浏览量
  • MQ夺命连环11问

    MQ丢失如果生产者保证消息发送到MQ,而MQ收到消息后还在内存中,这时候宕机了又没来得及同步给从节点,就有可能导致消息丢失。比如RocketMQ:RocketMQ分为同步刷盘和异步刷盘两种方式,默认的是异步刷盘,就有可能...
    文章 2021-03-05 721浏览量
  • 《阿里巴巴中台战略思想与架构实践》笔记

    但因为着急恢复系统,没有来得及定位之前造成开始服务实例出问题的根本原因,这样的系统恢复运行其实处于一个“脆弱”的状态,之前造成服务实例宕机的问题可能让“雪崩”事故再次上演。微服务架构的典型特征 分布式...
    文章 2020-01-10 769浏览量
  • 天梭M13为何具有大型水平的高可用性

    RAS特性是主机与一般服务器的主要区别,同时也是主机设计的一个难题,业界产品在技术上普遍具备了超过99.99%的高可用性,但是银行、保险、证券交易所等核心业务系统的宕机事件仍时有发生。100%的可靠是不存在的,但...
    文章 2017-08-02 1452浏览量
  • 【MOS】RAC 环境中 gc block lost 和私网通信性能问题...

    描述:服务器上错误的网卡绑定或链路聚合配置,邻接的私网交换上错误的聚合配置会导致性能下降,出现由"port flapping"导致的block loss,交换上构成私网端口的聚合链路发生频繁的"UP"/"DOWN"状态切换。...
    文章 2017-06-24 1552浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-02-07 7124浏览量
  • 历年双11实战经历者:我们是如何做数据库性能优化及运...

    比如Memory引擎的实例掉后,数据就会丢失,进而主备同步会断。Miyisam引擎不支持事务,在备份时候会锁住全库,造成主备延迟,对后端维护挑战非常大。所以作为云厂商,我们需要有一定的规范来控制住这些引擎的使用...
    文章 2017-09-07 10002浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-01-12 5751浏览量
  • 服务注册中心如何实现秒级服务上下线通知|...

    譬如当服务的进程宕机时,一般情况下 OS 立刻断开进程相关的连接(即发送 FIN),因此 SessionServer 能够实时感知连接断开事件,然后把该 connId 相关的所有 PublisherRegister 都清除,并且及时推送给所有服务...
    文章 2020-01-19 301浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4591浏览量
  • 做存储双活是好,但不能白白浪费了存储阵列软件

    说到数据中心的故障,IDC有一个大致的统计数字,逻辑故障占53%,硬件故障占47%,这也就意味着,大多数情况下存储双活面对的问题,不是系统宕机或是站点损毁,而是数据压根儿就是错的——这往往是逻辑故障所造成的。...
    文章 2017-08-09 2421浏览量
  • 重新定义数据库的时刻,阿里云数据库专家带你了解...

    网卡挂掉了,看上去像机器在系统中消失了,但本质上和宕机没有区别,因为宕机看上去也是机器突然消失了,所以在这种情况下,P问题就是A问题。第二种,机器的硬件不稳定,比如磁盘很卡导致响应请求很慢,这时候取决于...
    文章 2018-05-23 3166浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化