• 如何选择分布式事务解决方案?

    每一个 TM 域来说,由于 TM 是单点,存在单点故障风险,如果 TM 在阶段1之后挂掉,会导致参与的 RM 长时间收不到阶段 2 的请求而长期持有资源的锁,影响业务的吞吐能力。同时一次完整的全局事务,TM 和 RM 之间的...
    文章 2020-05-28 2022浏览量
  • DDD CQRS架构和传统架构的优缺点比较

    这些特性可以保证即便前端Controller在高峰时瞬间发送大量的Command过来,也不会导致后端处理Command的应用挂掉,因为我们是根据自己的消费能力拉取Command。这点也是CQRS C端在可用性方面的优势,其实本质也是分布...
    文章 2017-08-01 993浏览量
  • DDD CQRS架构和传统架构的优缺点比较

    这些特性可以保证即便前端Controller在高峰时瞬间发送大量的Command过来,也不会导致后端处理Command的应用挂掉,因为我们是根据自己的消费能力拉取Command。这点也是CQRS C端在可用性方面的优势,其实本质也是分布...
    文章 2016-05-27 4313浏览量
  • ENode 1.0-框架的总体目标

    那如果断电了,那理论上这100毫秒的数据不是就丢了,没关系,我们还可以同时把数据写入到多台mongodb server,也就是我们可以部署一个MongoDB server的集群,一般整个集群的所有机器都同时挂掉的可能性是很低的,...
    文章 2016-05-27 1586浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    一个可靠安全的系统,肯定要考虑数据的可靠性,尤其对于内存为主的 Redis,就要考虑一旦服务器挂掉,启动之后,如何恢复数据的问题,也就是说数据如何持久化的问题。AOF 就是备份操作记录。AOF 由于是备份操作命令,...
    文章 2020-12-30 224浏览量
  • DDD CQRS架构和传统架构的优缺点比较

    这些特性可以保证即便前端Controller在高峰时瞬间发送大量的Command过来,也不会导致后端处理Command的应用挂掉,因为我们是根据自己的消费能力拉取Command。这点也是CQRS C端在可用性方面的优势,其实本质也是分布...
    文章 2019-07-16 1704浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    做到每个环节使用相互独立的多台服务器进行分布式处理,要针对不同稳定性要求级别和成本能力做到不同服务器规模分布式,这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态...
    文章 2021-01-27 8333浏览量
  • 以电商网站为例,谈大型分布式架构设计与优化

    1.使用电商案例的原因 2.电商网站需求 3.网站初级架构 4.系统容量估算 5.网站架构分析 6.网站架构优化 本文主题为电商网站架构案例,将介绍如何从电商网站的需求,到单机架构,逐步演变为常用的、可供参考的分布式...
    文章 2017-11-23 1663浏览量
  • 浅谈系统实现层面稳定性保障

    业务大环境与业务架构稳定性一个人的命运必须要考虑历史进程影响,谈系统稳定性则不可以忽略大的业务环境,业务环境是指所在的部门业务现状,以及自己所在业务部门与其它业务部门的合作现状,可能发生的业务调整重组...
    文章 2021-09-23 12浏览量
  • 浅谈系统实现层面稳定性保障

    业务大环境与业务架构稳定性一个人的命运必须要考虑历史进程影响,谈系统稳定性则不可以忽略大的业务环境,业务环境是指所在的部门业务现状,以及自己所在业务部门与其它业务部门的合作现状,可能发生的业务调整重组...
    文章 2021-09-23 24浏览量
  • 大众点评账号业务高可用进阶之路

    每次收到告警,我们都要去找出背后的原因,如果是流量涨了,是有活动了还是被刷了?如果流量跌了,是日志延时了还是服务出问题了?另外值得重视的是告警的频次,如果告警太多就会稀释大家的警惕性。我们曾经踩过一次...
    文章 2018-06-14 1433浏览量
  • 阿里云专访Redisson作者Rui Gu:构建开源企业级Redis...

    setnx的设计缺乏一个延续有效期的续约机制,无法保证业务能够先工作做完再解锁,也不能确保在某个程序宕机或业务节点挂掉的时候,其它节点能够很快的恢复业务处理能力。3).不具备阻塞的能力平常大家多少都接触过的锁...
    文章 2018-06-25 10241浏览量
  • 自研分布式架构 SOFA 背后的工程师|1024快乐

    原因很简单,一个最简单的核心交易系统和核心账务系统,进行最简单的一个事务,也要经过十几次的消息传递,其中任何一次消息传递如果中断,那么这个事务就失败了,而且失败以后,当时业界的SOA标准并没有提出该怎么...
    文章 2018-10-22 2109浏览量
  • 厉害了,蚂蚁金服!创造了中国自己的数据库OceanBase

    陈萌萌对于“单机”的视角有一个形象的比喻:就像今天使用PC服务器,要担心如果突然某台PC服务器挂掉了、甚至机房本身遭遇地震、火灾等极端情况,如何保障数据访问的稳定性。由于是完全基于PC服务器架构,OceanBase...
    文章 2018-03-26 7660浏览量
  • Net 微服务架构技术栈的那些事

    一旦一个Pod被创建,系统就会不停的监控Pod的健康情况以及Pod所在主机的健康情况,如果这个Pod因为软件原因挂掉了或者所在的机器挂掉了,replication controller 会自动在一个健康的机器上创建一个一摸一样的Pod,来...
    文章 2020-04-08 878浏览量
  • 微服务架构详谈

    因为大部分的Java程序员开发生涯是从学习J2EE经典的分层理论开始的(Action、Service、Dao),在这种分层理论中,我们基本没有啥机会使用那些所谓的“行为”的设计模式,这里的核心原因,就是J2EE经典分层的开发...
    文章 2018-09-26 1212浏览量
  • 映客直播技术实战:直播平台的数据库架构演变

    而在这一方面,从业务层面来说业务可能处理的比较多的有两种分布式事务,第一类就是预占资源,预占资源就是比如是A要给B送礼或者A给B转账的时候,对于A而言需要扣钱,这部分是需要预先将钱扣掉的,然后再给B加上...
    文章 2017-09-01 7096浏览量
  • 超全总结|阿里如何应对电商故障?...

    系统改造验收:对于分布式系统,至少应该做到运行态中不会因为我依赖的系统出现故障,而引起当前应用出现可用性的问题,比如进程挂掉,频繁FullGC,负载飙高等,何时何地都具备快速止血的能力。限流降级参考:对于弱...
    文章 2017-06-19 3674浏览量
  • 微服务与配置中心:别让您的微服务被配置管理“绊”了...

    那为什么是弱依赖呢,最基本的一个道理,当业务系统即依赖配置中心的这些系统当它们不需要调整系统行为能力的时候,它其实是不用care这个时候配置中心服务到底在不在的,所以当我的配置中心服务挂掉的时候,影响应该...
    文章 2018-02-12 7272浏览量
  • 蚂蚁金服十年自研分布式中间件,成就世界级新金融科技...

    与操作系统和数据库不同,中间件并没有一个明确的定义,通常来说包括消息、数据、远程过程调用、对象请求代理、事务、构件等几个部分。随着互联网的快速发展,特别是云计算在近十年的蓬勃进展,企业的IT环境发生了...
    文章 2018-07-26 2963浏览量
  • 20 万网络节点背后的数据创新应用

    现在的业务场景都会做相关的容灾设备,服务器一个其实不会影响业务,但是到底有没有影响业务,从下面两层很难判断。由 此我们建立了从整体到局部的立体化全链路的监控体系。监控在DevOps里面的应用,随着我们运维...
    文章 2018-08-02 1075浏览量
  • 我们雇佣了一只大猴子.

    验证核心系统的同城一个机房挂掉的情况下,是否还可以正常工作。2015年因为一次宕机事故,公司内部得出一个结论:任何基础设施、生产系统、任何流程都可能出现问题,没有经过重大灾难验证的容灾设施都是耍流氓。启动...
    文章 2019-02-28 1999浏览量
  • 应用开发实践之关系数据库(以MySql为例)小结

    主要是一写多读的架构,在主库挂掉的场景下有可能需要考虑使用paxos算法来决定新的主库。在做读写分离前,可以先考虑缓存是否能解决当前场景的问题。五、运维 binlog记录DB操作(不含查询)及其他执行信息的二进制...
    文章 2020-05-05 623浏览量
  • ENode 2.0-整体架构介绍

    另一个重要的原因是,event store中的数据我们有时候是要被查询的。比如现在某个command遇到的并发冲突,那框架需要自动重试,但是重试之前需要先更新redis缓存,就是把eventstore里的最新的聚合根更新到redis缓存里...
    文章 2016-05-27 3396浏览量
  • 大促场景系统稳定性保障实践经验总结

    江煵在分享中提到,今年我们在新闻里听到了很多比较大的宕机事件,宕机的原因其实都很典型,删库跑路、被攻击、没有做好容量规划或者弹性能力不足、系统更改等。宕机后果还是比较严重,比如某SaaS服务商直接经济损失...
    文章 2020-11-12 6218浏览量
  • 饿了么技术往事(下)

    因此也没少吃亏,某业务系统 S 订阅了商户端领域数据库的部分 DRC 消息,商户端领域的开发团队在一次重构过程中,有部分相关的表不得不双写了半年,还下线不,因为 S 的技术团队没空改造……。合理的做法应该是,...
    文章 2020-11-26 3561浏览量
  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    就我个人的经验来说还没遇到过,但并非绝不可能,我想在常规的同一个JVM内部操作的线程会死掉的概率只有系统挂掉,不然SUN的java虚拟机也太不让人信任了;至少从这一点上我们可以决定在绝大部分情况下线程阻塞的主要...
    文章 2011-04-29 1900浏览量
  • 高可用互联网系统稳定性建设实践指南

    这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态获取资源服务(html&js&小程序包等)、域名解析、多服务商多区域多机房IP入口、静态资源服务、接入路由层、服务...
    文章 2021-09-01 56浏览量
  • 云栖干货回顾|“顶级玩家”集结!...

    米读在一周内紧急制定了基于RDS的解决方案,该方案基于单读写的RDS实例,并在后面根据用户ID做了分表,该方案上线后当晚就挂掉了。这是因为该方案存在几个非常明显的问题,首先读写并发存在明显瓶颈,无法满足增长...
    文章 2019-10-12 5654浏览量
  • 【双11背后的技术】万亿交易量级下的秒级监控

    监督主要通过监听Terminated事件实现,Terminated事件会在下游挂掉(不论是该协程挂掉还是所在的机器挂掉或是断网等)的时候发送给上游。由于拓扑是提前生成好且具备完备的描述信息,因此每个角色都可以根据拓扑的信息...
    文章 2017-01-12 5461浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化