• 微服务转型,雪崩效应是绕不过的一道坎

    如果机器掉电或者宕机了,如何做无缝切换都需要强大的部署管理机制。负载均衡:为应对大流量场景及提供系统可靠性,同一个业务系统也会做分布式部署即一个业务实例部署在多台机器上。如果某个业务系统挂掉了,如何按...
    文章 2017-09-04 2204浏览量
  • 日均请求量百亿级数据处理平台的容器云实践

    主要的问题是 FopGate 在过载时依然会崩溃,每个主机会过载出问题,造成请求变慢或者宕机。接下来讨论一下如何解决这些问题。如何应对官方数据处理的挑战 系统测量 第一,测量 FopGate 的服务能力。按照线上的配置,...
    文章 2017-05-02 1301浏览量
  • 读《SRE:Google运维解密》一点思考

    SRE在Google不负责某个服务的上线、部署,SRE主要是保障服务的可靠性和性能,同时负责数据中资源分配,为重要服务预留资源,SRE并不负责某个业务逻辑的具体编写,主要负责在服务出现宕机等紧急事故时,可以快速作出...
    文章 2019-12-16 2881浏览量
  • 63分59秒1000亿,如何抗住双11高并发流量?

    这是一个理想的估算,在实际的生产环境中,由于服务发布,宕机等各种各样的原因,情况肯定会比这个更差。对于一些比较敏感的业务,比如金融,或是对服务稳定要求较高的行业,比如订单或者支付业务,这样的情况是不能...
    文章 2019-11-11 885浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-02-07 7075浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-01-12 5726浏览量
  • 如何搭建亿级社交信息分享平台?

    更不用说服务器磁盘故障甚至是宕机了,如何保证业务的稳定也会是一个大大的问题。4.成本 好了,假设我们使用一个良好的方案解决了并发、性能以及稳定性上的问题,服务运行良好,往往这个时候业务也度过了野蛮生长的...
    文章 2016-12-08 6875浏览量
  • 分布式熔断、限流与服务保护:深入 Hystrix 原理及...

    如上图,假如服务I出现较严重延迟,这时上层应用访问量tps比较大时,首先上层应用资源会被占满,并且一般网络请求(http/rpc)都有重试机制,服务I的压力会更大,严重时则会导致应用宕机。​ hystrix 工作流程 首先...
    文章 2019-03-19 2654浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    推断异常出现的位置及原因&xff0c;并给予初步的建议解决方案&xff0c;则将对系统状态稳定起到巨大的作用。传统的时间序列数据异常检测方法通常聚焦在一维场景下&xff0c;根据不同时间点数据样本间的关联来对异常进行判断...
    文章 2021-07-06 428浏览量
  • 想染指系统架构?你绝对不可错过的一篇

    宕机时间取决于备用服务器处于“热”待机状态还是需要从“冷”待机状态进行启动。只有工作服务器处理流量。工作到备用的故障切换也被称为主从切换。双工作切换(Active-active) 在双工作切换中,双方都在管控流量,...
    文章 2017-10-17 2243浏览量
  • [译]系统设计入门|掘金翻译计划

    宕机时间取决于备用服务器处于“热”待机状态还是需要从“冷”待机状态进行启动。只有工作服务器处理流量。工作到备用的故障切换也被称为主从切换。双工作切换(Active-active) 在双工作切换中,双方都在管控流量,...
    文章 2017-10-16 1766浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化