• 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1014浏览量
  • Kubernetes是否存在“杀敌一千,自损八百”的问题?

    在另一方面,Kubernetes的意外复杂性很低而必要复杂性很高(实现用户实际想要实现的目标所需要的复杂性)。Kubernetes之所以如此强大,是因为它已经是谷歌的第三代容器管理技术——而Swarm与ECS还只是第一代。...
    文章 2017-10-11 1313浏览量
  • 【分布式系统工程实现】GFS&Bigtable设计的优势

    当Tablet Server宕机时,由于只需要排序很少的操作日志并且加载服务的Tablet的索引,宕机恢复可以做到一分钟以内。Bigtable分裂和迁移到只需要修改或者加载索引数据,因此效率很高,整个系统的扩展很好。GFS&...
    文章 2016-04-11 1706浏览量
  • 分布式系统工程实现:GFS&Bigtable设计的优势,...

    当Tablet Server宕机时,由于只需要排序很少的操作日志并且加载服务的Tablet的索引,宕机恢复可以做到一分钟以内。Bigtable分裂和迁移到只需要修改或者加载索引数据,因此效率很高,整个系统的扩展很好。GFS&...
    文章 1970-01-01 897浏览量
  • rmq_vs_kafka

    RocketMQ在阿里云已经商业化,目前以云服务形式供大家商用,并向用户承诺99.99%的可靠性,同时彻底解决了用户自己搭建MQ产品的运维复杂性问题 成熟度 卡夫卡在日志领域比较成熟 RocketMQ在阿里集团内部有大量的应用...
    文章 2016-04-08 4538浏览量
  • RocketMQ与kafka对比(18项差异)

    MQ#商业支持卡夫卡原开发团队成立新公司,目前暂没有相关产品看到RocketMQ在阿里云已经商业化,目前以云服务形式供大家商用,并向用户承诺99.99%的可靠性,同时彻底解决了用户自己搭建MQ产品的运维复杂性问题成熟度 ...
    文章 2017-04-05 5473浏览量
  • 黑客与宕机

    对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack is corrupted in:ffffxxxxxxxx87eb",如图 2 所示。图2 关于这条信息,我们必须逐字解读。Kernel panic-not syncing:...
    文章 2020-07-17 792浏览量
  • 10款常见MySQL高可用方案选型解读

    并且多节点同时宕机的几率也要小于单节点宕机的几率,所以多节点架构在一定程度上可以认为高可用是好于双节点架构。但由于数据库数量较多,所以需要数据库管理软件来保证数据库的可维护。可以选择MMM、MHA或者...
    文章 2017-05-16 5872浏览量
  • MySQL数据库的几种常见高可用方案

    并且多节点同时宕机的几率也要小于单节点宕机的几率,所以多节点架构在一定程度上可以认为高可用是好于双节点架构。但是由于数据库数量较多,所以需要数据库管理软件来保证数据库的可维护。可以选择MMM、MHA或者...
    文章 2017-04-25 12775浏览量
  • 《深入分布式缓存》之“分布式理论:CAP是三选二吗?

    有对应的的原因包括日常演练等问题,等更重要的是在[可用和一致]之间选择了一致,4H之后提供服务,备库仍然主要起数据备份的作用。有限制处理方案是需要冒险滴,为了保障可用,无法保障数据100%精确,可以...
    文章 2018-01-24 945浏览量
  • 分布式理论:CAP是三选二吗?

    现实情况 下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会 导致 Partition,因而分布式系统实现中 P 是一个必须项,而不是可选项。高可用、数据一致是很多系统设计的目标,但是分区又是不...
    文章 2018-03-19 4123浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1487浏览量
  • 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    业务系统安全工程框架由于业务系统以及故障原因复杂性,单纯的从一个或多个点出发很难解决问题。业务系统安全工程以控制论和系统论为指导,以风险控制方法为工具,形成了自己的实施框架 IPDRI,即识别(identify)...
    文章 2021-07-06 226浏览量
  • 把大型和云计算联系在一起 没毛病!

    这里且不论技术层面的数据一致性理论(核心应用最关键所在就是数据,根据CAP理论,强一致性、可用性、分区容错性不能同时满足,这是分布式系统的一个弱点),单论你这么做后的采购成本、运维管理复杂性、运维成本等...
    文章 2017-07-03 1315浏览量
  • 把大型和云计算联系在一起 没毛病!

    这里且不论技术层面的数据一致性理论(核心应用最关键所在就是数据,根据CAP理论,强一致性、可用性、分区容错性不能同时满足,这是分布式系统的一个弱点),单论你这么做后的采购成本、运维管理复杂性、运维成本等...
    文章 2017-09-01 1500浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4591浏览量
  • Apache RocketMQ QuickStart

    RocketMQ在阿里云上已经开放公测近半年,目前以云服务形式免费供大家商用,并向用户承诺99.99%的可靠性,同时彻底解决了用户自己搭建MQ产品的运维复杂性问题 成熟度 Kafka在日志领域比较成熟 RocketMQ在阿里集团内部...
    文章 2017-09-29 2364浏览量
  • 重新定义数据库的时刻,阿里云数据库专家带你了解...

    操作数据的复杂性直接带来的后果就是,数据很难再被利用。但是,在这个新时代,数据像是石油,价值非常之大。下图解释了CAP理论是怎么变化的。CAP中C代表一致性,A代表可用性,P代表分区容忍性,CAP的核心在于指出了...
    文章 2018-05-23 3166浏览量
  • CAP的相对论

    有关中行IBM大型机宕机的报道link: http://digi.tech.qq.com/zt2013/syibm/ http://www.infoq.com/cn/news/2013/04/BOC-Downtime/超越CAP?Nathan Marz:How to beat the CAP theorem 2011年11月Twitter的首席...
    文章 2016-07-07 4204浏览量
  • 基于 Seata Saga 设计更有弹性的金融应用

    在更上层的业务系统因为流程多流程长,开发 TCC 成本比较高,大都会权衡采用 Saga 模式来到达业务最终一致,由于历史的原因不同的 BU 有自己的一套“补偿”事务的方案,基本上是两种: 一种是当一个服务在失败时...
    文章 2019-11-07 703浏览量
  • “拟态防御”:让黑客找不到破门之

    继10月美国网站大规模宕机后,当地时间11月27日欧洲最大电信运营商德国电信又遭受严重攻击,导致约90万路由器发生故障,连续两日断网。物联网时代,当所有的设备都变成智能化,都接入网络后,边界的概念将会进一步被...
    文章 2017-08-01 1371浏览量
  • 中国院士提"拟态防御":让黑客找不到破门之

    继10月美国网站大规模宕机后,当地时间11月27日欧洲最大电信运营商德国电信又遭受严重攻击,导致约90万路由器发生故障,连续两日断网。物联网时代,当所有的设备都变成智能化,都接入网络后,边界的概念将会进一步被...
    文章 2017-08-01 964浏览量
  • 系统设计之——架构师职责和设计原则

    服务器可能宕机,网络交换机可能发生故障,服务器时钟可能出错,磁位存储介质可能损坏等。设计分布式存储系统需要考虑这些因素,将他们看成系统运行过程中必然发生的“正常情况”。这些错误发生时,要求系统能够自动...
    文章 2018-11-18 2601浏览量
  • Seata 长事务解决方案 Saga 模式|SOFAChannel#10 回顾

    当一台应用实例宕机时: Seata Server 会感知到,并发送事务恢复请求到还存活的应用实例;状态机引擎收到事务恢复请求后,从数据库里装载日志,并恢复状态机上下文继续执行;Saga 模式下服务设计的实践经验 下面是...
    文章 2020-01-19 799浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 3018浏览量
  • 容器化应用的服务可用

    对于电话软件,99.999%的服务可用是必需具备的(例如每年只能有小于5.26分钟的故障宕机时间)。我在摩托罗拉和贝尔实验室的后续几年,学习了如何建立和运维高可用系统。在那个时代里(约为90年代中期),高可用...
    文章 2017-10-10 1141浏览量
  • 如何选择分布式事务解决方案?

    XA 两阶段协议可能会造成脑裂的异常,假如 TM 在阶段 2 通知 RM 提交事务时,如果指令发出后就宕机了,而只有部分 RM 收到了提交请求,那么当 TM 恢复的时候,就无法协调本次事务所有的 RM 本地事务的一致了。...
    文章 2020-05-28 2168浏览量
  • 分布式事务概念详解

    根据系统可用计算公式,假设每个月43200分钟,99.9%的可用就是43157分钟,99.8%的可用就是43114分钟,相当于每个月的宕机时间增加了43分钟。以上,可以验证出来,CAP定理从理论上来讲是正确的,CAP我们先看到...
    文章 2018-03-26 1144浏览量
  • 应用性能管理工具怎么选?掌握四项基本原则

    应用和基础设施的变更从根本上降低了可视化程度且提高了应用的复杂性。为了主动解决这些性能问题这些变更计划应该包括APM的实施。本文出处畅享网 本文来自云栖社区合作伙伴畅享网了解相关信息可以关注vsharing.com...
    文章 2018-03-16 1268浏览量
  • 图形数据库和NOSQL

    高可用(A):所有客户端总能找到所请求数据的至少一个版本,即使集群中某些机器已经宕机, 分区容忍(P):整个系统保持自己的特征,即使是被部署到不同服务器上的时候,这对客户端来讲是透明的。CAP法则假定向...
    文章 2017-05-17 1651浏览量
1 2 3 4 ... 7 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化