• SUN平台,光纤共享存储互斥失败导致的数据灾难恢复

    B机newfs实际上直接会作用于原先的文件系统之上,但此例与单纯的newfs会有些不同,在A机宕机之前,会有一小部分数据(包括数据)回写回文件系统。newfs如果结构与之前的相同,数据区是不会被破坏的,同时如果有一小...
    文章 2017-11-29 810浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-17 4410浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-11 2185浏览量
  • MongoDB高可用集群配置的几种方案

    Mongodb的Replica Set即副本集方式主要有两个目的,一个是数据冗余做故障恢复使用,当发生硬件故障或者其它原因造成的宕机时,可以使用副本进行恢复。另一个是做读写分离,读的请求分流到副本上,减轻主(Primary)...
    文章 2016-10-11 22226浏览量
  • 《Hadoop与大数据挖掘》一2.1.2 Hadoop存储—HDFS

    (3)第二名称节点(Secondary NameNode)第二名称节点的作用在于为HDFS中的名称节点提供一个Checkpoint,它只是名称节点的一个助手节点,这也是它在社区内被认为是Checkpoint Node的原因。如图2-3所示,只有在...
    文章 2017-06-26 1579浏览量
  • 独家支持用户自建、混合云环境集群,快收下这份HBase...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-12-17 613浏览量
  • MongoDB trouble shoot sharded clusters

    如果宕机的是从库,则副本集会让这台从库与主库断开连接,并且这台从库的数据不会被清空。在三个成员副本集中,即使该的单个成员遇到灾难性故障,另外两个成员也有完整的数据副本。经常去检查可用性是否中断以及...
    文章 2017-11-08 1407浏览量
  • 极速同步如何保证反向同步数据一致性

    同时每个开启极速同步的共享会发送心跳包到消息主题,如果没有收到心跳包,有可能是消息主题/消息队列不可访问导致消息通路中断或者是网关宕机很长一段时间才恢复。MNS可以保证已经成功投递的消息至少会被消费一次...
    文章 2020-01-17 742浏览量
  • 自己动手写SQL执行引擎

    结构如下所示:一个元组(tuple/item)在一个page中分为定长的ItemPointer和不定长的Item两部分。其中ItemPointer里面存储了对应item的起始偏移和长度。同时ItemPointer和Item如图所示是向着中心方向进行伸张,这种结构...
    文章 2020-05-24 516浏览量
  • 短短数月,两代“矿工”遭遇冰与火的洗礼

    他还表示,挖矿的过程中总会遇到宕机、网络故障、电网故障、币价浮动等问题,这导致了“矿场”月收益很难达到20万的理论值。甚至只有理论值的50-60%,“说白了,原先就只赚了个打工钱,但现在不亏我已经偷着笑了。...
    文章 2018-04-16 1087浏览量
  • 万字长文剖析AliSQL X-Cluster|基于X-Paxos的高性能...

    如上图所示,一个三节点的X-Cluster集群,左边的Case是原Leader A节点宕机,因此B节点和C节点会在较长的时间内收不到Leader的心跳,因此在一个选举超时周期后,B节点开始尝试推选自己为Leader,并且C节点同意,那么B...
    文章 2017-08-10 5919浏览量
  • MySQL阶段三——MySQL事务

    不同之处在于,设置为2 时,当MySQL 数据库发生宕机而操作系统及服务器并没有发生宕机时,由于此时未写入磁盘的事务日志保存在文件系统缓存中,当恢复时同样能保证数据不丢失。二、undo Undolog:在操作任何数据之前...
    文章 2017-11-12 1338浏览量
  • RabbitMQ 高可用之镜像队列

    简单总结下:镜像队列是用于节点之间同步消息的机制,避免某个节点宕机而导致的服务不可用或消息丢失,且针对排他性队列设置是无效的。另外很重要的一点,镜像队列机制不是负载均衡。文章来源:...
    文章 2018-12-28 2226浏览量
  • WSFC 状态操作指南

    1.节点宕机 2.其它节点检测注册表 挂载共享存储联机上线 3.节点恢复 4.故障回复群集角色 对于群集故障转移,这里特别要说的是故障回复,这是个老古董了,从2003时代就看到它,故障回复必须和首选所有者功能相配合,...
    文章 2017-11-12 1243浏览量
  • 如何选择分布式事务解决方案?

    TM 在阶段 1 中询问 RM 完毕,但是在就准备完成日志时宕机,因不清楚宕机前的事务协商的结果,因此恢复后需要向 RM 发起回滚请求。TM 在阶段 1 中记录完毕事务准备完成日志后宕机,恢复后可以根据日志发起提交或者回...
    文章 2020-05-28 2022浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    找出top N机器所有通信有问题的五元组(协议、源地址、源端口、目的地址、目的端口),根据五元组算出所有通信的路径。对于算出路径上的网络设备,查询其错误日志,看是否有相应的故障,有问题报警给网络。如果有...
    文章 2016-12-18 4668浏览量
  • HDFS源码分析之FSImage文件内容(一)总体格式

    它的作用不言而喻,在HA出现之前,NameNode因为各种原因宕机后,若要恢复或在其他机器上重启NameNode,重新组织数据,就需要加载对应的FSImage文件、FSEditLog文件,并在内存中重做FSEditLog文件中的事务条目。...
    文章 2016-04-29 1025浏览量
  • RocketMQ高可用探究:消息存储技术

    RocketMQ是阿里开源的分布式消息中间件,跟其它中间件相比,RocketMQ的特点是纯JAVA实现、集群和HA实现相对简单、在发生宕机和其它故障时消息丢失率更低,具有良好的高可用架构及稳定性。其发展的迭代历史如下图所示...
    文章 2020-06-01 1409浏览量
  • RMQ——支持合并和优先级的消息队列

    正常情况下,消费者不管消费失败还是消费成功,都会从PrepareQueue删除消息,当消费者系统发生异常或者宕机的时候,消息就无法从PrepareQueue中删除,我们也不知道消费者是否消费成功,为保障消息至少被消费一次,...
    文章 2020-12-21 389浏览量
  • 中国移动苏州研发中心消息队列高可用设计之谈|...

    仅仅在客户端维护一个本地缓存还不够,因为如果集群中的 Leader 节点出现了宕机的故障时,集群会发生重新选举,那么客户端缓存的 Leader 节点信息就会过期,这就需要客户端就能够感知到 Leader 节点的变化。...
    文章 2019-08-14 6235浏览量
  • 分布式存储系统基础

    引发服务器宕机的原因有很多,例如内存错误、服务器停电等等。服务器宕机可能随时发生,当发生宕机时,节点无法正常工作。服务器重启后,节点将失去所有的内存信息。因此,设计存储系统时需要考虑如何通过读取持久化...
    文章 2017-08-09 1636浏览量
  • 阿里巴巴为什么不用 ZooKeeper 做服务发现?

    发生这个异常的原因有很多,例如应用机器与 ZooKeeper 节点之间网络闪断,ZooKeeper 节点宕机,服务端 Full GC 时间超长,甚至你的应用进程 Hang 死,应用进程 Full GC 时间超长之后恢复都有可能。要理解这个异常,...
    文章 2018-06-06 25782浏览量
  • [数据恢复答疑]RAID真的安全吗?

    但当其中一块盘出现故障时,存储在这块故障盘上的原有数据就要通过其他硬盘的数据恢复出来,当然这个过程中控制器(硬RAID为RAID卡,软RAID实际上是个驱动)会负责这个工作,同时为了保证不宕机,控制器也会保证存储的...
    文章 2017-11-22 1240浏览量
  • 阿里巴巴为什么不用 ZooKeeper 做服务发现?

    发生这个异常的原因有很多,例如应用机器与ZooKeeper节点之间网络闪断,ZooKeeper节点宕机,服务端Full GC时间超长,甚至你的应用进程Hang死,应用进程 Full GC 时间超长之后恢复都有可能。要理解这个异常,需要了解...
    文章 2018-06-12 7565浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4573浏览量
  • 《Hadoop与大数据挖掘》——第2章 大数据存储与运算...

    第二名称节点的作用在于为HDFS中的名称节点提供一个Checkpoint,它只是名称节点的一个助手节点,这也是它在社区内被认为是Checkpoint Node的原因。如图2-3所示,只有在NameNode重启时,edits才会合并到fsimage文件中...
    文章 2017-07-03 2160浏览量
  • 蚂蚁智能监控

    容灾架构 前文简要提及了架构去单点问题的解决思路,这足以覆盖日常可能发生的节点宕机、网络抖动等小规模故障场景,但是当真正的毁灭性灾难来临时,还需要更高层面的容灾方案来应对。目前基于不同租户保障等级的...
    文章 2021-09-07 29浏览量
  • 带你读《HBase原理与实践》之一:HBase概述

    cell:单元格,由五元组(row,column,timestamp,type,value)组成的结构,其中type表示Put/Delete这样的操作类型,timestamp代表这个cell的版本。这个结构在数据库中实际是以KV结构存储的,其中(row,column,...
    文章 2019-11-01 3362浏览量
  • 浅谈分布式一致性:Raft 与 SOFAJRaft

    连续确定多个提案,确保集群中各个系统节点状态完全一致自动选主,保证在只有少数派宕机的情况下持续可用日志强同步,宕机后零数据丢失三 SOFAJRaft一个纯 Java 的 raft 算法实现库,使用 Java 重写了所有功能,并有...
    文章 2021-06-01 5794浏览量
  • 阿里云基础产品技术月刊 2019年3月

    阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些...
    文章 2019-04-11 4389浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化