• 《Akka应用模式:分布式应用程序设计实践指南》读书...

    告诉发生故障的actor继续处理消息,即忽略发生故障的消息。Restart。告诉发生故障的actor应该重启。Stop。告诉发生故障的actor应该被停止。比如临时、一次性的actor,失败后不再需要,就可以停止。Escalate。将故障...
    文章 2018-06-12 1543浏览量
  • ebay增强可用性的4个原则(2)

    故障隔离使我们能够更优雅地处理这些故障。讨论了为什么应该为产品建立泳道或设置故障隔离&xff0c;现在我们把注意力转向更重要的问题&xff0c;如何实现故障隔离。依靠四条原则来定义和帮助我们设计泳道。第一个原则是...
    文章 2022-01-23 64浏览量
  • 电商平台迎战大促季峰值的运维技巧

    异步调用:同步调用改成异步调用,解决远程调用故障或调用超时对系统的影响;服务降级:牺牲非核心业务,保证核心业务的高可用。所有好的架构设计首要的原则并不是追求先进,而是合理性,要与公司的业务规模和发展...
    文章 2018-06-06 1766浏览量
  • 构架分布式队列编程

    在进行通信发送方设计的时候,令工程师们苦恼的问题是:如果消息无法被迅速处理掉而产生堆积怎么办、能否被直接抛弃?如果根据需求分析,确认存在消息积存,并且消息不应该被抛弃,就应该考虑分布式队列编程模型构架...
    文章 2016-08-11 1053浏览量
  • 如何防止HA集群的脑裂

    对MySQL,即使配置成半同步复制,在超时发生后,它可能会自动降级为异步复制。为了防止MySQL的复制降级,可以设置一个超大的rpl_semi_sync_master_timeout,同时保持rpl_semi_sync_master_wait_no_slave为on(即...
    文章 2015-11-18 3534浏览量
  • 回调函数

    (4)事件处理程序:当事情发生时该怎么办呢?交给谁处理呢?比如班长发现小明捣乱不让同桌睡觉,就会通知班主任(事件处理程序)处理. 回调函数就相当于事件处理程序.上述代码中的ring就是回调函数,也是事件处理程序. lt;...
    文章 2015-05-20 1008浏览量
  • 亲身体验及举例来全面解析C#异步编程

    原始的代码并没有关注异常,它会一直传递给调用者,在异步版本中,我们必须扩展回掉来让异常来传播,在异常发生时,我们不得不明确的让它传播。最终,这些需要将会进一步让代码混乱: public void ...
    文章 2017-08-01 942浏览量
  • 大众点评工程师:从黄金圈法则看MySQL数据库复制

    问题二:因为复制是有延迟的,肯定会发生主库写了,但是从库还没有读到的情况,遇到这种问题怎么办?答:MySQL支持不同的复制策略,基于不同的复制策略达到的效果也是不一样的,如果是异步复制,MySQL不能保证从库...
    文章 2017-05-02 1547浏览量
  • 链路分析 K.O“五大经典问题”

    单机故障每时每刻都在频繁发生,特别是核心集群由于节点数量比较多,从统计概率来看几乎是一种“必然”事件。单机故障不会造成服务大面积不可用,但会造成少量用户请求失败或超时,持续影响用户体验,并造成一定答疑...
    文章 2021-11-27 156浏览量
  • 01RabbitMQ入门

    小结好处:吞吐量提升:无需等待订阅者处理完成,响应更快速故障隔离:服务没有直接调用,不存在级联失败问题调用间没有阻塞,不会造成无效的资源占用耦合度极低,每个服务都可以灵活插拔,可替换流量削峰:不管发布...
    文章 2022-09-10 83浏览量
  • 三高Mysql-搭建“三高”架构之复制(上)

    半同步复制时间等待过久怎么办&xff1f;rpl_semi_sync_master_timeout 参数可以配置脱扣时间&xff0c;脱扣时间是主备库之间的同步过了多少时间超时。组复制&xff08;Mysql Group Replication&xff09;组复制是MySQL5.7版本...
    文章 2022-06-23 32浏览量
  • 数据库读写分离同步延时问题怎么解决?

    当正式队员(主库)发生故障,我们就可以人工让其下线,让替补队员(备库)顶上。引出的问题:随着业务大规模爆发,主库的压力过大,我们就想让备库承担起更大的责任来。1.3 读写分离架构读写分离架构本质也就是主备...
    文章 2022-05-25 134浏览量
  • 传统企业数据库上云案例分享

    但是从节点势必会引起延迟,当主节点发生故障的时候,这个时候不知道从节点的数据是不是最新的,因此如果切换从节点,很有可能会造成数据的丢失。为了解决这个问题,MySQL官方提供了另一种方式,半同步复制。半同步...
    文章 2018-05-30 3086浏览量
  • ElasticSearch Reading and Writing documents ...

    故障处理在特殊情况下会导致错误发生,例如磁盘可能会损坏,节点可能会和其他节点失去练剑,或者有些错误配置导致副本分片上的操作失败尽管这些操作在主分片上是成功的。这些情况虽然是常见的,但是主分片不得不汇报...
    文章 2018-10-24 1107浏览量
  • 给运维做运维:我们是怎么从苦逼到流弊的?

    对于计划内的故障,我们知道服务器即将故障或者可能要故障了,怎么办?是不是可以把上面的云主机直接迁移到没有问题的主机上呢?一定可以。这种技术是开源的技术,但是开源的技术只能解决通用的需求,解决不了真正的...
    文章 2017-11-15 2284浏览量
  • 分布式系统,你真的了解吗?

    一般我们在写功能代码的时候,是不会考虑到硬件故障的时候应该怎么办的。而如果在编写分布式系统的时候,就一定需要面对这个问题了。否则,很可能只有一台服务器出故障,整个数百台服务器的集群都工作不正常了。除了...
    文章 2017-08-01 1202浏览量
  • 链路分析 K.O“五大经典问题”

    生产环境很多故障发生都是由于缺乏有效的灰度监控导致的。例如&xff0c;当微服务注册中心异常时&xff0c;重启发布的机器无法进行服务注册上线。由于缺乏灰度监控&xff0c;前几批重启机器虽然全部注册失败&xff0c;导致所有...
    文章 2021-12-16 3108浏览量
  • 链路分析 K.O“五大经典问题”

    生产环境很多故障发生都是由于缺乏有效的灰度监控导致的。例如&xff0c;当微服务注册中心异常时&xff0c;重启发布的机器无法进行服务注册上线。由于缺乏灰度监控&xff0c;前几批重启机器虽然全部注册失败&xff0c;导致所有...
    文章 2022-04-11 63浏览量
  • 搞懂分布式技术20:消息队列因何而生

    好吧,应该说理论上的100%,排除系统严重故障和bug。像Kafka一类的设计,在设计层面上就有丢消息的可能(比如定时刷盘,如果掉电就会丢消息)。哪怕只丢千分之一的消息,业务也必须用其他的手段来保证结果正确。广播...
    文章 2018-06-24 1550浏览量
  • 如何通过事务消息保障抢购业务的分布式一致性?

    一旦协调者发生故障&xff0c;参与者会一直阻塞下去&xff0c;整个系统将无法工作&xff0c;因此需要投入巨大的精力来保障事务协调者的高可用性。数据不一致问题。在阶段二中&xff0c;如果协调者向参与者发送commit请求之后&xff...
    文章 2021-02-24 2778浏览量
  • 彻底厘清真实世界中的分布式系统

    讨论故障容忍(fault-tolerant)系统时,很重要的一点是把拜占庭故障(实质上就是任意的故障)考虑在内。此类故障包括但不限于:试图破坏系统的攻击。例如,一次安全攻击可能会生成或者伪造消息。拜占庭将军问题是两...
    文章 2017-09-22 1589浏览量
  • ​分布式系统与单节点系统的本质区别是什么?

    我们需要定义一个故障模型并描述故障可能发生的方式&xff0c;然后再决定如何处理它们。如果系统在故障发生时仍然能继续正常运行&xff0c;我们将这样的特性称为容错性。故障是不可避免的&xff0c;所以我们需要构建出具有...
    文章 2022-01-25 68浏览量
  • 大众点评开源分布式监控平台 CAT 深度剖析

    高可用:所有应用都倒下了,需要监控还站着,并告诉工程师发生了什么,做到故障还原和问题定位。故障容忍:CAT本身故障不应该影响业务正常运转,CAT挂了,应用不该受影响,只是监控能力暂时减弱。高吞吐:要想还原...
    文章 2016-11-15 2537浏览量
  • 《解读NoSQL》——2.6 通过数据库分片获得水平扩展...

    本节书摘来自异步社区出版社《解读NoSQL》一书中的第2章,第2.6节,作者:【美】Dan McCreary(丹•麦克雷),Ann Kelly(安•凯利),更多章节内容可以访问云栖社区“异步社区”公众号查看。2.6 通过数据库分片获得...
    文章 2017-05-02 1881浏览量
  • 架构文摘:消息队列设计精要

    你可能会问,如果producer和consumer本身就在两个机房了,怎么办?首先,broker必须保证感知的到所有consumer的存在。其次,producer尽量选择就近的机房就好了。高可用 其实所有的高可用,是依赖于RPC和存储的高可...
    文章 2018-06-03 1410浏览量
  • ENode 1.0-框架的总体目标

    支持command的同步和异步处理,同步处理时要允许客户端捕获异常,异步处理时要允许客户端设置回调函数;应用编程模型要统一,框架api要简单、好用、一致、好理解;能让开发人员只关注业务,不用关心数据哪里来,以及...
    文章 2016-05-27 1738浏览量
  • 消息队列设计精要

    你可能会问,如果producer和consumer本身就在两个机房了,怎么办?首先,broker必须保证感知的到所有consumer的存在。其次,producer尽量选择就近的机房就好了。高可用 其实所有的高可用,是依赖于RPC和存储的高可...
    文章 2017-12-31 1483浏览量
  • 分布式系统数据层设计模式

    表示能容忍的从故障发生到系统恢复正常运转的时间,这个时间越短,容灾要求越高。RPO,Recovery Point Objective,数据恢复点目标。表示能容忍故障造成过去多长时间的数据丢失,RPO 为 0 表示不允许数据丢失。分布式...
    文章 2019-08-03 850浏览量
  • 前端开发中的JS调试技巧

    譬如,快速定位问题、降低故障概率、帮助分析逻辑错误等等。而在互联网前端开发越来越重要的今天,如何在前端开发中降低开发成本,提升工作效率,掌握前端开发调试技巧尤为重要。本文将一一讲解各种前端JS调试技巧,...
    文章 2017-05-05 1007浏览量
  • 细说 Azure Storage 的冗余策略

    当时最担心的是:用户的数据万一丢掉怎么办?同时,我们是不是可以根据云服务提供的数据服务的特点来优化程序的性能呢?基于如此种种的原因,我们需要了解云端数据服务的一些特性的详情,这将对我们很有帮助。本文将...
    文章 2017-10-04 1195浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化