• WSFC 强制仲裁影响讨论

    手动调整各节点投票资格比较主流的场景是灾难恢复时避免自动故障转移带来的额外宕机时间,因为SQL 故障转移时间较长,如果是跨站点就更长了,我们希望每次故障转移都是可控的,这时就可以将群集控制为手动故障转移...
    文章 2017-11-12 996浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1468浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 2986浏览量
  • Apache RocketMQ QuickStart

    开源版本的RocketMQ不支持Master宕机,Slave自动切换为Master,阿里云版本的RocketMQ支持自动切换特性。性能对比 Kafka单机写入TPS约在百万条/秒,消息大小10个字节 RocketMQ单机写入TPS单实例约7万条/秒,单机部署3...
    文章 2017-09-29 2346浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4581浏览量
  • MySQL 半同步复制+MMM架构

    semi_sync_master_wait_point=AFTER_SYNC”该参数是控制主库响应从库的binlog发生在flush disk之前,在5.6版本当主库flush disk之后才发送binlog如果这时主库由于某种原因宕机了,这时如果客户端没有收到从库的响应...
    文章 2013-10-09 957浏览量
  • 天天用Redis,持久化方案有哪些你知道吗?

    理论上只有在系统突然宕机的情况下丢失1秒的数据(当然,这是不太准确的)。文件重写机制 随着命令不断写入AOF,文件会越来越大,为了解决这个问题,Redis引入AOF重写机制压缩文件体积。AOF文件重写是把Redis进程内...
    文章 2020-04-20 536浏览量
  • 知乎技术分享:从单机到2000万QPS并发的Redis高性能...

    5)Sentinel 切换功能主要依赖 down-after-milliseconds 和 failover-timeout 两个参数,down-after-milliseconds 决定了 Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则...
    文章 2018-09-18 2981浏览量
  • 流量激增不宕机,服务限流系统架构解密

    限流的性能:限流的功能理论上是会在一定程度影响到业务正常性能的,因此需要做到限流的性能优化和控制。四、总结 系统故障常常都是不可预测且难以避免的,因此作为系统设计师的我们,必须要提前预设各种措施,以...
    文章 2018-11-14 1679浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1861浏览量
  • Seata-AT 如何保证分布式事务一致性

    Raft 集成的原因,可能大部分用户不是特别知晓,首先要知道目前 TC 端的事务信息都是存储在外部存储器,比如数据库、redis、mongodb(PR 阶段),这就造成了如果外部存储宕机,Seata-Server 集群的完全不可用。...
    文章 2020-12-28 5878浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-02-07 7075浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-01-12 5726浏览量
  • NoSQL生态系统——一致性RWN协议,向量时钟,gossip...

    它的过程是如果负责某个key值的某个节点宕机了,另一个节点会被选择作为其临时切换点,以临时保存在故障节点上面的写操作。这些写操作被单独保存起来,直到故障节点恢复正常,临时节点会把这些写操作重新迁移给刚刚...
    文章 2017-11-15 1244浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之一:...

    内燃机的发明解决了交通工具的发动机问题,运输类设备迎来了巨大的发展空间。在20世纪50年代之前,设备主要依靠电力或内燃机提供动力。随着技术的改良和进步,设备效率不断提升,加工速度不断提高。但制造过程中,...
    文章 2019-11-08 1312浏览量
  • Oracle数据库备份恢复的概念:错误类型、实例恢复方法...

    5.实例错误:比如数据库突然宕机;6.媒体错误:比如因为磁盘损坏或者OS级别删除而丢失了数据库文件;Statement Failure 1.试图往表中插入非法数据:需要程序前端做验证,或者让用户修改数据;2.尝试执行某个操作时权限不足:...
    文章 2017-05-02 1588浏览量
  • 分布式事务概念详解

    根据系统可用性计算公式,假设每个月43200分钟,99.9%的可用性就是43157分钟,99.8%的可用性就是43114分钟,相当于每个月的宕机时间增加了43分钟。以上,可以验证出来,CAP定理从理论上来讲是正确的,CAP我们先看到...
    文章 2018-03-26 1121浏览量
  • 系统稳定性——So Hot?快给 CPU 降降温!

    当 CPU 过于繁忙,就像“人脑”并发处理过多的事情,会降低做事的效率,严重时甚至会导致崩溃“宕机”。因此,理解 CPU 的工作原理,合理控制负载,是保障系统稳定持续运行的重要手段。目录 CPU 的物理核与逻辑核 ...
    文章 2019-08-26 952浏览量
  • 阿里云基础产品技术月刊 2019年3月

    阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些...
    文章 2019-04-11 4405浏览量
  • 云服务器 ECS 监控:监控ECS实例

    假如没有进行监控,就很有可能在业务高峰期性能不足却无人问津而导致宕机;也可能在出现异常和故障的时候,因为没有历史性能数据而无法进一步追查到原因,可见,没有监控,当问题出现的时候,都非常被动。因此,监控...
    文章 2017-08-14 4789浏览量
  • 【内含干货PPT下载】DTCC 2020|阿里云王涛:阿里巴巴...

    高可用:数据库主备架构,高可用性保障,宕机自动切换、修复。高可靠:数据库多副本保障、数据同步可调一致性保障(RPO优先)、三节点企业版RPO=0保障。高性能:内核性能提升,相比开源版本MySQL(1.5x)\Redis(3x...
    文章 2021-01-06 2034浏览量
  • 分布式事务 Seata TCC 模式深度解析|SOFAChannel#4 ...

    在业务启动时,Seata 框架会自动扫描识别到 TCC 接口的调用方和发布方。如果是 RPC 的话,就是 sofa:reference、sofa:service、dubbo:reference、dubbo:service 等。扫描到 TCC 接口的调用方和发布方之后。如果是...
    文章 2019-08-01 1342浏览量
  • 区块链信用机制与应用场景介绍

    同时,所有节点实时同步,谁也无法实现全局控制,且永不宕机。3.价值传递 区块链可以完整、“不可篡改”地记录价值转移的全过程,这使得账本证明交易记录具有唯一性,即同一个标的物不可能同时卖给两个人,即避免...
    文章 2018-07-30 1803浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    自动故障转移(Automatic Failover):当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点。配置提供者(Configuration ...
    文章 2020-12-30 229浏览量
  • 分布式事务 Seata TCC 模式深度解析|SOFAChannel#4 ...

    在业务启动时,Seata 框架会自动扫描识别到 TCC 接口的调用方和发布方。如果是 RPC 的话,就是 sofa:reference、sofa:service、dubbo:reference、dubbo:service 等。扫描到 TCC 接口的调用方和发布方之后。如果是...
    文章 2019-04-24 1525浏览量
  • 血泪总结!创业公司CTO要避免哪些坑?

    先让我从印象最深的一次宕机讲起。有一天,有一台机器的容器挂了,我对技术人员说,你把机器重启一下吧!然后他就去了。结果没几秒钟,突然收到报警。我问那位同事,你做了什么?他反问,你不是让我重启服务器吗?...
    文章 2017-06-12 34217浏览量
  • 基于Redis实现特殊的消息队列

    但是消费者还没来得及消费完成系统就宕机了&xff0c;消息消费超时到了后&xff0c;消息会被重新放入StoreQueue&xff0c;等待下次被消费&xff0c;消息不丢失。消费者接收到了消息并消费成功&xff0c;消费者端在协调事务提交的...
    文章 2021-09-27 95浏览量
  • Service Mesh 高可用在企业级生产中的实践

    Consul 使用 Raft 协议作为其分布式一致性协议,本身对故障节点有一定的容忍性,在单个 DataCenter 中 Consul 集群中节点的数量控制在 2*n+1 个节点,其中 n 为可容忍的宕机个数。Quorum size:Raft 协议选举...
    文章 2020-06-03 296浏览量
  • Redis持久化存储详解(一)

    理论上只有在系统突然宕机的情况下丢失1秒的数据. 文件重载 1.为什么要文件做文件重载操作?由于aof采用的是日志追加,我们redis命令不断的写入,aof文件的体积也也会不断的增加.因此redis引入了aof重写机制达到减小...
    文章 2019-03-12 1228浏览量
  • 反应式编程探索与总结

    需要异步的原因,是为了并行的使用资源,在多个主机或同一主机多个CPU核的场景下。The main goal of Reactive Streams is to govern the exchange of stream data across an asynchronous boundary – think passing...
    文章 2019-11-25 967浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化