• ORA-00445报错问题的处理

    虽然数据库并没有宕机,但是MMON停止了工作82800s,停止了AWR报告和ASH的收集的工作,调优一下就抓瞎了。三、问题的原因 在metalink上面搜索了一下,找到了问题的原因及方法,现在和大家分享,原因如下: Recent ...
    文章 2014-05-25 919浏览量
  • keepalived工作原理及裂脑

    (1)简单判断的思想:只要备节点出现VIP就报警,这个报警可以有两种情况,一是主机宕机了备机接管了;二是主机没宕,裂脑了,不管哪种情况,都进行报警,然后由人工查看判断及解决。(2)比较严谨的判断:备节点...
    文章 2017-11-09 1080浏览量
  • 关于Redis的几件小事|高并发和高可用

    有了min-slaves-max-lag这个配置,就可以确保说,一旦slave复制数据和ack延时太长,就认为可能master宕机后损失的数据太多了,那么就拒绝写请求,这样可以把master宕机时由于部分数据未同步到slave导致的数据丢失...
    文章 2019-07-23 973浏览量
  • TFS分布式文件系统应用

    当由于dataserver服务器宕机或由于其他原因退出系统导致某些文件副本数量下降时,nameserver将会调度新的dataserver节点存储文件备份。同样为了保证数据一致性,当写入一个文件时,只有所有参与的dataserver均写入...
    文章 2017-10-13 6000浏览量
  • HDFS简单入门

    经过协调校验,无论是传输错误,I/O错误,还是个别服务器宕机,整个系统里的文件是完整的 分布后的文件系统有个无法回避的问题,因为文件不在一个磁盘导致读取访问操作的延时,这个是HDFS现在遇到的主要问题。现阶段...
    文章 2016-04-21 4147浏览量
  • 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络的拓扑...
    文章 2017-08-01 1041浏览量
  • 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络的拓扑...
    文章 2017-07-03 764浏览量
  • 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么 ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络的拓扑...
    文章 2017-09-02 940浏览量
  • 一文看懂 kafka 机制

    或选择第一个“活”过来的Replica(不一定是ISR中的)作为Leader),这个broker宕机的事情,kafka controller也会通知zookeeper,zookeeper就会通知其他的kafka broker。如果这个kafka broker controller宕机了,在...
    文章 2018-07-09 7675浏览量
  • RedLock究竟是不是Redis分布式锁分布式环境下的银弹?

    我们回顾 1 观点,深究抽象出现这个缺陷的根本原因,就是为了解决由于系统宕机带来的锁失效而给锁强加了一个失效时间,异常情况下,程序(业务)执行的时间大于锁失效时间从而造成的一系列的问题,我们能否从这方面...
    文章 2020-06-29 531浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2786浏览量
  • 异地多活没那么难

    用户暂时修改不了用户信息,对于其业务不会有很大影响,而如果有几百万用户登录不了,就相当于几百万用户无法使用业务,对业务的影响就非常大了:公司的客服热线很快就被打爆了,微博微信上到处都在传业务宕机,论坛...
    文章 2017-07-03 5557浏览量
  • DATA GUARD最大可用性优缺点1

    并不是互斥的,前面已经提到RAC实际上是实例级别的容灾,但是各个实例在后台任然使用了一份DATAFILE,通常这份DATAFILE保存在磁盘阵列这样的可以共享的存储里面,假设我们一个实例由于未知的原因出现了错误宕机了,...
    文章 2011-04-29 1215浏览量
  • 异地多活设计辣么难?其实是你想多了!

    用户暂时修改不了用户信息,对于其业务不会有很大影响,而如果有几百万用户登录不了,就相当于几百万用户无法使用业务,对业务的影响就非常大了:公司的客服热线很快就被打爆了,微博微信上到处都在传业务宕机,论坛...
    文章 2016-07-15 32869浏览量
  • heartbeat基础知识

    指定的时间内未收到对方发送的心跳报文,那么,一方就会认为对方失效或者是已经宕机了,这时每个运行正常的主机就会启动自身的资源接管模块来接管运行在对方 主机上的资源或者是服务,继续为用户提供服务。一般情况...
    文章 2017-11-27 948浏览量
  • 网易云音乐的消息队列改造之路

    另外消息系统也会出现宕机宕机选主也有一段时间(秒级),虽然客户端有重试能力,但是有些场景不能很好满足。因此,消息队列提供了降级组件,在系统异常时,客户端会将消息发送本地或者发送到容灾集群,降低系统...
    文章 2019-07-25 3645浏览量
  • 为什么Flink会成为下一代大数据处理框架的标准?

    因此Flink较其他分布式处理的框架则会显得更加稳定,不会因为JVM GC等问题而导致整个应用宕机的问题。Save Points(保存点) 对于7*24小时运行的流式应用,数据源源不断的接入,在一段时间内应用的终止都有可能导致...
    文章 2019-09-21 1170浏览量
  • 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-04-18 1787浏览量
  • 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-03-12 980浏览量
  • OceanBase实践入门:高可用原理和容灾方案

    事务日志除了能用于本机数据库宕机恢复外,还可以用于构建冗余副本(即备库)并保持主备同步。然而不同数据库在实现上面方案的细节上又不完全相同,导致实际效果并不完全一样,需要懂这个原理才能区分。比如说MySQL...
    文章 2019-08-05 3320浏览量
  • Linux之HA高可用集群的基础概念总结

    后端RS-server,数据库服务器,共享存储等集群节点做一个从备份服务器或者多个服务器互相备份,一旦主服务器挂掉,备份服务器能立马检测到并取代主服务器上的资源继续运行服务,从而最大限度避免了因服务器宕机造成...
    文章 2017-05-02 1420浏览量
  • RMQ——支持合并和优先级的消息队列

    正常情况下,消费者不管消费失败还是消费成功,都会从PrepareQueue删除消息,当消费者系统发生异常或者宕机的时候,消息就无法从PrepareQueue中删除,我们也不知道消费者是否消费成功,为保障消息至少被消费一次,...
    文章 2020-12-21 414浏览量
  • 天网智能化,打造最安全的智慧城市

    系统可启用集群工作模式进行高可用保护,保证单台节点设备宕机的情况下,迅速由其它节点设备接管它的工作。在宕机设备恢复正常后,可以自动加入集群并与其他节点进行负载分担,提高系统自保护能力,保证智能分析的...
    文章 2017-07-04 966浏览量
  • 《策略驱动型数据中心——ACI技术详解》一第1章 数据...

    第一条连接到架顶式(ToR)交换机的电缆在某种意义上讲已属于“矩阵”,因为它承载着从多台主机传输到连接的第一台物理网络设备的流量,这台设备是ToR或接入交换机。连接的第一台交换机现在可能会是一台虚拟交换机...
    文章 2017-05-02 2393浏览量
  • Everything you should know about etcd

    etcd的高可用容许少于一半个节点宕机,当宕机的是少量节点的时候,如果节点网络、存储等基础物理资源不存在问题,那么只需要修改-initial-cluster-state的状态改为existing,并重启etcd即可。但是这种可能性是非常小...
    文章 2018-01-21 4575浏览量
  • 《策略驱动型数据中心——ACI技术详解》——第1章 ...

    第一条连接到架顶式(ToR)交换机的电缆在某种意义上讲已属于“矩阵”,因为它承载着从多台主机传输到连接的第一台物理网络设备的流量,这台设备是ToR或接入交换机。连接的第一台交换机现在可能会是一台虚拟交换机...
    文章 2017-05-02 2036浏览量
  • 《叶问》第1期

    1、人为原因导致从库与主库数据不一致(从库写入)2、主从复制过程中,主库异常宕机3、设置了ignore/do/rewrite等replication等规则4、binlog非row格式5、异步复制本身不保证,半同步存在提交读的问题,增强半同步...
    文章 2018-11-29 1390浏览量
  • 高可用之2——存储b

    曾经碰到过这样的问题,比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个lun给两个主机,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后...
    文章 2012-06-02 1344浏览量
  • 轻松搞定RocketMQ入门

    FLUSH_SLAVE_TIMEOUT:消息发送成功,但是服务器同步到 Slave 时超时,消息已经进入服务器队列,只有此时服务器宕机,消息才会丢失 SLAVE_NOT_AVAILABLE:消息发送成功,但是此时 slave 不可用,消息已经进入服务器...
    文章 2018-08-10 28839浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4586浏览量
1 2 3 4 ... 7 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化