• 数据中心设计建造中的八个事实

    宕机的损失变得越来越大。若一个网站宕机,一个潜在的客户就会在8秒钟之内离开,去访问另一个网站;若一个路由器宕机:局域网上就可能有几百个用户无法工作;若一个光纤室宕机:就可能有几千个用户断开网络连接,损失...
    文章 2017-09-01 1070浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-11 2214浏览量
  • 黑客与宕机

    不管是 Linux 或 Windows,在系统宕机之后,都能够通过自动,或者人工的方式,产生内存转储。分析 Linux 内存转储的第一步,我们使用 crash 工具打开内存转储,并用 sys 命令观察系统的基本信息和宕机的直接原因。...
    文章 2020-07-17 792浏览量
  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-10-17 4489浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1487浏览量
  • 独家支持用户自建、混合云环境集群,快收下这份HBase...

    HDFS是一个Master-Slave模式的分布式文件系统,存在中心节点Namenode,Namenode支持以HA方式部署,单Namenode故障可秒级恢复,在两个NN都宕机的情况下依然可以重启自愈,但恢复时间取决于回放日志大小,在分钟级别。...
    文章 2019-12-17 773浏览量
  • 【分布式系统工程实现】GFS&Bigtable设计的优势

    当然,对应用方来说仍然是一整套系统,当某台Tablet Server宕机时,只影响短时间部分数据的写服务,读服务如果不要求强一致性不受影响。描述CAP理论时我们经常会说,Dynamo是AP的系统,Bigtable是CA的系统。然而,...
    文章 2016-04-11 1706浏览量
  • 分布式系统工程实现:GFS&Bigtable设计的优势,...

    当然,对应用方来说仍然是一整套系统,当某台Tablet Server宕机时,只影响短时间部分数据的写服务,读服务如果不要求强一致性不受影响。描述CAP理论时我们经常会说,Dynamo是AP的系统,Bigtable是CA的系统。然而,...
    文章 1970-01-01 897浏览量
  • 分库分表中间件的高可用实践

    保证事务小是非常重要的,但是这在中间件宕机的时候会导致一些问题,如下图所示:如上图所示,在故障发现窗口期中(即还没有确定某台中间件不可用时),数据源是随机选择连接的。而这个连接就有一定1/N(N为中间件个数)...
    文章 2019-05-15 1779浏览量
  • RedLock究竟是不是Redis分布式锁分布式环境下的银弹?

    我们回顾 1 观点,深究抽象出现这个缺陷的根本原因,就是为了解决由于系统宕机带来的锁失效而给锁强加了一个失效时间,异常情况下,程序(业务)执行的时间大于锁失效时间从而造成的一系列的问题,我们能否从这方面...
    文章 2020-06-29 540浏览量
  • 我们雇佣了一只大猴子.

    2015年因为一次宕机事故,公司内部得出一个结论:任何基础设施、生产系统、任何流程都可能出现问题,没有经过重大灾难验证的容灾设施都是耍流氓。启动了代号为虎虎虎的生产突袭项目,用来验证异地多活的质量。2016年...
    文章 2019-02-28 2046浏览量
  • 分布式存储系统基础

    引发服务器宕机的原因有很多,例如内存错误、服务器停电等等。服务器宕机可能随时发生,当发生宕机时,节点无法正常工作。服务器重启后,节点将失去所有的内存信息。因此,设计存储系统时需要考虑如何通过读取持久化...
    文章 2017-08-09 1647浏览量
  • JAVA—Spring—SpringCloud—一.分布式系统

    Bean的方式配置dubbo6.dubbo的高可用当dubbo的注册中心宕机之后,消费者和服务提供者之间依然可以通过本地缓存通讯,不会因为宕机影响到服务7.直连dubbo&64;Reference(url&61;34;127.0.0.1:20880&34;当dubbo宕机之后也...
    文章 2021-11-12 29浏览量
  • RMQ——支持合并和优先级的消息队列

    定时3s逻辑是为了使用消费者端实现PrepareQueue超时回滚功能,PrepareQueue中需要超时回滚的情况一般是由于系统重启、系统宕机、网络丢包导致,一般不会出现很多消息需要超时回滚,所以这里采用定时3s检查避免性能...
    文章 2020-12-21 464浏览量
  • Oceanbase – 千亿级海量数据库

    另外,机器宕机时需要通过commit log记录的状态修改信息将服务迁移到集群中的其它节点。2,子表的分裂和合并。B+树实现的难点在于树节点的分裂与合并,在分布式系统中,数据被顺序划分为大小在几十到几百MB大小的数据...
    文章 2016-04-11 2389浏览量
  • 云原生应用和容器设计模式的综述和展望

    这就好像大多非云计算公司的计算机系统或虚拟机系统,运维人员要悉心维护,经常更新操作系统和用户密码,开放端口要申请审批,万一以外宕机了,运维人员要心疼的。牲畜则不一样,牲畜存在的唯一意义是提供肉制品和奶...
    文章 2016-12-13 2466浏览量
  • RocketMQ高可用探究:消息存储技术

    RocketMQ是阿里开源的分布式消息中间件,跟其它中间件相比,RocketMQ的特点是纯JAVA实现、集群和HA实现相对简单、在发生宕机和其它故障时消息丢失率更低,具有良好的高可用架构及稳定性。其发展的迭代历史如下图所示...
    文章 2020-06-01 1430浏览量
  • 流量激增不宕机服务限流系统架构解密

    如果你的系统理论是时间单位内可服务100W用户,但是今天却突然来了300W用户,由于用户流量的随机性,如果不限流,很有可能这300W用户瞬间就压垮了系统,导致所有人都得不到服务。因此为了保证系统至少还能为100W用户...
    文章 2018-11-14 1689浏览量
  • 中国移动苏州研发中心消息队列高可用设计之谈|...

    仅仅在客户端维护一个本地缓存还不够,因为如果集群中的 Leader 节点出现了宕机的故障时,集群会发生重新选举,那么客户端缓存的 Leader 节点信息就会过期,这就需要客户端就能够感知到 Leader 节点的变化。...
    文章 2019-08-14 6269浏览量
  • HBase最佳实践-读性能优化策略

    数据本地率低的原因一般是因为Region迁移(自动balance开启、RegionServer宕机迁移、手动迁移等),因此一方面可以通过避免Region无故迁移来保持数据本地率,另一方面如果数据本地率很低,也可以通过执行major_...
    文章 2018-12-28 1626浏览量
  • 万字长文剖析AliSQL X-Cluster|基于X-Paxos的高性能...

    应用往往对于容灾后新主节点是有要求的,在原先的主节点意外宕机后,新主如若落在了一个低规格的节点,那么对于应用来说是很难接受的服务降级。X-Cluster 支持同一个集群中的节点拥有不同的优先级,用户可以根据实际...
    文章 2017-08-10 6033浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    所有的三个系统都可以通过在线增加节点线性扩容,只有一对系统可以在宕机时收到写操作。所有的解决方案中都没有内置的方式将变化通知下游依赖,因此可能需要在应用层实现该功能。它们都有索引功能,但是如果你想索引...
    文章 2017-05-02 1870浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4724浏览量
  • VmWare平台Windows Server 2012 无响应宕机

    无法进入系统,实质上就是一个宕机的情况。4:出现问题是随机的,没有任何规律可言,有时候隔了个把月出现一次,有时候好长时间才出现。碰到这种情况,只能在VMware vSphere Client里面,选择该服务器,单击右键选择...
    文章 1970-01-01 1014浏览量
  • 读《大型网站技术架构》

    2)服务器越多,宕机的概率越大 常用的分布式方案: 1)分布式应用和服务;2)分布式静态资源;3)分布式数据和存储;4)分布式计算;5)分布式配置、分布式锁、分布式文件系统。集群,即多台服务器部署相同的应用,...
    文章 2017-04-09 981浏览量
  • 在云中扩展服务器的11个技巧

    新传入的流量不会到达宕机的服务器,因为负载平衡器会将新流量定向到可以处理它的服务器。场景 B:一次自然灾难袭击了整个东海岸。您的应用程序将会如何反应?如果即将出现这种情况,那么应该一切正常,因为您会在...
    文章 2017-07-04 1134浏览量
  • 带你读《HBase原理与实践》之一:HBase概述

    因为稳定性的原因,并不建议在生产线上使用1.0.0~1.1.2中间的版本。目前,HBase社区推荐使用的稳定版本为1.4.10。2.x版本是接下来最受期待的一个版本(升级要慎重,请参考社区中的实践),因为最近一两年社区开发的...
    文章 2019-11-01 3526浏览量
  • HBase最佳实践-读性能优化策略

    数据本地率低的原因一般是因为Region迁移(自动balance开启、RegionServer宕机迁移、手动迁移等),因此一方面可以通过避免Region无故迁移来保持数据本地率,另一方面如果数据本地率很低,也可以通过执行major_compact...
    文章 2017-08-01 682浏览量
  • HBase最佳实践-读性能优化策略

    数据本地率低的原因一般是因为Region迁移(自动balance开启、RegionServer宕机迁移、手动迁移等),因此一方面可以通过避免Region无故迁移来保持数据本地率,另一方面如果数据本地率很低,也可以通过执行major_compact...
    文章 2017-08-02 2725浏览量
  • HBase最佳实践-读性能优化策略

    数据本地率低的原因一般是因为Region迁移(自动balance开启、RegionServer宕机迁移、手动迁移等),因此一方面可以通过避免Region无故迁移来保持数据本地率,另一方面如果数据本地率很低,也可以通过执行major_...
    文章 2017-08-01 1283浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化