• 《Greenplum5.0 最佳实践》系统监控与维护(五)

    通常,我们执行 gpstate 命令会获得如下信息,这些信息包裹当前有多少个段数据库在运行,多少个段数据挂掉了,如果存在数据库挂掉了,这就需要我们注意解决问题了,因为挂点的点很容易引起计算倾斜等问题。...
    文章 2017-11-03 2148浏览量
  • ETCD系列之一:简介

    挂掉的节点再次当选主节点,它将缺失部分已提交的日志。在这样场景下,按Raft协议,它将自己日志复制给其他节点,会将集群已经提交的日志给覆盖掉。这显然是不可接受的。其他协议解决这个问题的办法是,新当选的主...
    文章 2016-03-27 71894浏览量
  • GFS架构启示|Google File System

    画外音:与分布式文件系统对应的,是单机文件系统,Windows和Linux操作系统都有文件系统。GFS的设计目标是什么?主要有四个目标: (1)高可用(availability);(2)高可靠(reliability);(3)高性能(performance)...
    文章 2018-11-27 1888浏览量
  • GFS架构启示|Google File System

    画外音:与分布式文件系统对应的,是单机文件系统,Windows和Linux操作系统都有文件系统。GFS的设计目标是什么?主要有四个目标: (1)高可用(availability);(2)高可靠(reliability);(3)高性能(performance)...
    文章 2019-08-08 633浏览量
  • Database·理论基础·关于一致性协议和分布式锁

    这种auto release lock 会存在的问题是,用户获得lock 操作以后,redlock 的做法有一个lease,如果在这个lease 里面不执行unlock 操作,系统只能认为你已经挂掉.那么在过了lease 时间以后,另外一个node 获得了这个Lock,...
    文章 2018-10-22 1418浏览量
  • zookeeper 应用场景

    那么这分列表显然不能存储在一台单节点的服务器上,否则这个节点挂掉了,整个集群都会发生故障,我们希望这份列表时高可用的。高可用的解决方案是:这份列表是分布式存储的,它是由存储这份列表的服务器共同管理的,...
    文章 2017-11-17 1029浏览量
  • 如何设计稳定性横跨全球的 Cron 服务

    那么仅仅需要指定它运行在哪个数据中心即可,剩下的事情就依赖于数据中心的调度系统(当然前提是调度系统也应该是可靠的),调度系统会负责在哪台或者哪些机器上运行服务,以及能够良好的处理机器挂掉这种情况。...
    文章 2017-06-05 1109浏览量
  • 阿里P8架构师谈:Zookeeper的原理和架构设计,以及...

    任何一个节点挂掉都不会影响整个集群的数据一致性(总2n+1台,除非挂掉大于n台)。总结:Zookeeper 作为 Hadoop 项目中的一个子项目,是 Hadoop 集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它...
    文章 2019-01-17 3534浏览量
  • 一招一式攻克linux(四)

    tftp服务器 tftp服务器主要用于远程系统引导或远程备份象cisco这样的网络设备的配置文件,例如tftp服务器与dhcp、ftp服务器相配合,就可以成为一组linux安装服务器,以利于进行大规模的网络安装linux操作系统。...
    文章 2017-11-09 1052浏览量
  • 论文阅读笔记(三)

    此外,还存在着“影子”主节点,它们在主节点挂掉后提供对文件系统的只读访问,它们不是主节点的镜像,一般会比主节点的状态要滞后一些。为了保持对主节点的更新,影子主节点会读取操作日志并施加这些操作到其数据...
    文章 2018-01-08 1178浏览量
  • CAP理论以及服务注册与发现

    关于P的理解,我觉得是在整个系统中某个部分,挂掉了,或者宕机了,并不影响整个系统的运作或者说使用,而可用性是,某个系统的某个节点挂了,但是并不影响系统的接受或者发出请求,CAP 不可能都取,只能取其中2个 ...
    文章 2017-11-16 1196浏览量
  • CAP理论以及服务注册与发现

    关于P的理解,我觉得是在整个系统中某个部分,挂掉了,或者宕机了,并不影响整个系统的运作或者说使用,而可用性是,某个系统的某个节点挂了,但是并不影响系统的接受或者发出请求,CAP 不可能都取,只能取其中2个 ...
    文章 2017-11-09 778浏览量
  • 2017QCon分享:从淘宝到云端的高可用架构演进

    比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
    文章 2017-10-25 2960浏览量
  • 分布式锁在存储系统中的技术实践

    同时结合具体的业务场景,例如守护进程发现锁持有进程挂掉的场景,提供锁的CAS释放操作,使得进程可以零等待进行抢锁。比如利用在锁节点中存放进程的唯一标识,强制释放已经不再使用的锁,并重新争抢,该方式可以...
    文章 2020-09-01 1284浏览量
  • 如何选择合适的数据库,让游戏更高效可用

    接着我们考虑更新探测,自己找系统表update,如果更新成功,说明业务可写,更新超时或失败就切换,但当业务压力变大时,操作系统并不是直接罢工,还是尽力的提供服务,当磁盘IOPS达到100%时,不是突然变成零,也是有...
    文章 2017-04-19 5480浏览量
  • mysql 高可用方案漫谈(二)

    当A机房挂掉,或者实例在A机房的主机挂掉,那么leader 在B,C机房产生,此时由于B 机房可以连通leader 那么认为自己可以继续服务;C 机房挂掉,那么leader 在A,B中产生,A,B 都能连通leader,那么仍然都可以继续服务...
    文章 2015-12-29 9596浏览量
  • 【IaaS&PaaS】为什么选择PaaS?

    因为我们还是要关心操作系统挂掉、机器宕机等因素,如果我们不关心,或者说我们从业务的架构上不考虑这些因素,是很难保证业务稳定的。而PaaS呢?PaaS帮我们节省了蓝色涉及的部分,也就是说除了IaaS节省的部分外,还...
    文章 2017-08-02 3993浏览量
  • 纯干货|从淘宝到云端的高可用架构演进

    比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
    文章 2017-06-19 2172浏览量
  • 数据库大讲堂·第三期 亲历阿里云0到1的数据库老司机...

    这是第一个阶段,接下来即便要进入第二阶段也轻易不敢进入,不敢进入的原因是如果一台主机挂掉备用机器要百分百支撑起主机挂掉的情况,这里的主机挂掉是指主机的CPU突然损坏或者常见的硬盘损坏等场景,导致主机可能...
    文章 2020-10-29 904浏览量
  • 《Apache Zookeeper官方文档》2-综述

    消息层 关注的是当leader节点挂掉之后怎么去替换他,并同步leader节点和follower节点之间的数据. zookeeper 使用客户端端原子消息协议.因为消息层是原子的,zookeeper 能保证本地副本和服务器版本相同步. 当leader...
    文章 2016-04-01 1479浏览量
  • Greenplum在企业生产中的最佳实践(上)

    当时它做了很多的调优工作,包括底层用了GP的资源队列,甚至还用了操作系统的Cgroup,对IO做了限制。但是效果都不太理想。因为Cgroup也是通用采样的方式,在一个周期里面会控制IO使用。但是对于一些大的查询,如果把...
    文章 2017-07-29 4721浏览量
  • ​我们的系统需要什么样的分布式锁?

    同时结合具体的业务场景,例如守护进程发现锁持有进程挂掉的场景,提供锁的 CAS 释放操作,使得进程可以零等待进行抢锁。比如利用在锁节点中存放进程的唯一标识,强制释放已经不再使用的锁,并重新争抢,该方式可以...
    文章 2020-07-06 1346浏览量
  • 分布式文件系统MFS(moosefs)实现存储共享(第二版)

    元数据服务器可以是linux,也可以是unix,你可以根据自己的使用习惯选择操作系统,在我的环境里,我是用freebsd做为MFS元数据的运行平台。GNU源码,在各种类unix平台的安装都基本一致。(一)安装元数据服务 1、下载GNU...
    文章 2017-11-09 1122浏览量
  • 数据库与存储系统

    操作系统里面的内存分为两个基本的部分:用户空间和内核空间,内核空间主要存放操作系统自身的软件代码和数据,如驱动程序,任务调度,内存分配和管理的程序。用户空间用以存放用户自己的应用程序;数据库系统对于...
    文章 2017-05-02 1762浏览量
  • Hbase问题汇总与解答

    一个常问的问题就是Master挂掉的时候,Hbase会发生什么事情,因为Hbase客户端是直接和RegionServer进行通信,而且hbase:meta表并没有存在Master节点上,Master只是进行RegionServer的故障恢复和Region的切分,因此在...
    文章 2019-01-31 193788浏览量
  • 高可用的本质

    假设单点的可靠性假设是99.99%,它要提升到99.999%是非常困难的,但是如果无单点而是依赖2个(1个挂掉没有关系,只要不同时挂就行),那整体可靠性就是99.999999%会有质的提升。单点故障会导致无法快速止血,拉长...
    文章 2021-02-22 1045浏览量
  • 消息中间件kafka+zookeeper集群部署、测试与应用

    移步阿帕奇官网下载最新版zookeeper,Zookeeper集群的工作是超过半数才能对外提供服务,3台中超过两台超过半数,允许1台挂掉。创建目录 zookeeper:mkdir zookeeper解压下载后的压缩文件 tar-zxvf zookeeper-3.4.6....
    文章 2017-12-20 1810浏览量
  • Highly Available(Mirrored)Queues

    消费端如果引入了Consumer Cancellation Notification,那么当当前的queue挂掉的时候应该被通知到。由于requeue的存在,客户端当重新消费queue的时候,有可能将之前消费过的消息又顺序的消费一遍。当一个slave提升为...
    文章 2017-05-11 1135浏览量
  • 如何用消息系统避免分布式事务?

    前阵子从支付宝转账1万块钱到余额宝,这是日常生活的一件普通小事,但作为互联网研发人员的职业病,我就思考支付宝扣除1万之后,如果系统挂掉怎么办,这时余额宝账户并没有增加1万,数据就会出现不一致状况了。...
    文章 2016-07-13 5441浏览量
  • 意外断电造成RAID 5阵列卡数据故障的恢复方法

    两者操作系统都为Window 2000,数据库是Server 2000。HP LH6000的故障如下:一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。解决办法如下: 1.启动...
    文章 2017-11-15 1585浏览量
1 2 3 4 ... 15 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化