• OceanBase高可用实践

    分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,...
    文章 2019-07-28 1553浏览量
  • 数百万台车联网设备同时在线0故障,中瑞集团的云原生...

    但在这种情况下,RocketMQ集群处于一种比较脆弱的状态,需要使用者想办法进行系统性的补救,以确保在下一次出现节点宕机的时候,RocketMQ集群依然能够稳定得运行。比如当一个Master Broker节点出现故障后,虽然Slave...
    文章 2020-10-28 5018浏览量
  • 蚂蚁金服自研数据库OceanBase如何登顶TPC-C

    第二个阶段称为现场预审计,美国的审计员来到蚂蚁金服杭州总部,和 OceanBase 团队成员一起完成功能测试、ACID 测试、性能测试、宕机测试、架构和代码 Review、性能成本计算等全部过程。当时在这个过程中发现了一些...
    文章 2019-10-05 5838浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4668浏览量
  • 数百万台车联网设备同时在线 0 故障,中瑞集团的云...

    以确保在下一次出现节点宕机的时候&xff0c;RocketMQ集群依然能够稳定得运行。比如当一个Master Broker节点出现故障后&xff0c;虽然Slave Broker节点依然可以承担消息收发的任务&xff0c;而且RocketMQ的消息同步机制确保了...
    文章 2021-09-08 246浏览量
  • 历年双11实战经历者:我们是如何做数据库性能优化及运...

    面对这样的问题,很多时候是DB节点发生了主备切换,OOM或者crash,这样的情形是比较好排查的,但是对于DB上层的链路,比如proxy出现了抖动,上层SLB做了网络变更,甚至再上层的网络交换出现了down或者丢包,这个...
    文章 2017-09-07 9952浏览量
  • 厉害了,蚂蚁金服!创造了中国自己的数据库OceanBase

    这其中的原因很多,除了最早投入、培养了最多的相关技术研发人才和技术积累外,更重要的原因在于作为全球化的商用软件产品,无论是微软的操作系统还是甲骨文的数据库,都是伴随着全球用户集体使用、集体反馈、集体...
    文章 2018-03-26 7660浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化