• 关于

    交换级宕机的原因

    的搜索结果
  • 阿里云ECS跨地域整站容灾操作指南

    其中的连续复制型(CDR)基于磁盘数据连续复制技术,可以为企业关键业务提供低至秒RPO,分钟RTO的容灾服务,极大缩短业务宕机时间,减少数据丢失损失。其一键演练,全链路监控,自动化运维等功能更是解决了传统...

    文章 倾随 2019-10-27 4582浏览量

  • keepalived工作原理及裂脑

    (1)简单判断的思想:只要备节点出现VIP就报警,这个报警可以有两种情况,一是主机宕机了备机接管了;二是主机没宕,裂脑了,不管哪种情况,都进行报警,然后由人工查看判断及解决。(2)比较严谨的判断:备节点...

    文章 科技探索者 2017-11-09 1034浏览量

  • 消息中间件选型分析

    RabbitMQ不会为未确认的消息设置过期时间,它判断此消息是否需要重新投递给消费者的唯一依据是消费该消息的消费者连接是否已经断开,这么设计的原因是RabbitMQ允许消费者消费一条消息的时间可以很久很久。...

    文章 java猫 2019-04-15 1119浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • Apache Flink 在快手的过去、现在和未来

    宕机快速发现方面,我们研发了 Hawk Service,它是一个多数派的连通性检测服务,具体的检测流程是 Hawk 集群中多个工作节点会周期性地检测集群中每台机器的连通性,由于它是多数派的,所以可信度是有保障的。...

    文章 阿里云实时计算Flink 2021-02-26 973浏览量

  • 做存储双活是好,但不能白白浪费了存储阵列软件

    说到数据中心的故障,IDC有一个大致的统计数字,逻辑故障占53%,硬件故障占47%,这也就意味着,大多数情况下存储双活面对的问题,不是系统宕机或是站点损毁,而是数据压根儿就是错的——这往往是逻辑故障所造成的。...

    文章 boxti 2017-08-09 2270浏览量

  • 详细讲解!RabbitMQ防止数据丢失

    首先看Exchange交换机的类图: 看这个类图其实是要说明上一篇文章介绍的四种交换机都是AbstractExchange抽象类的子类,所以根据java的特性,创建子类的实例会先调用父类的构造器,父类也就是AbstractExchange的构造...

    文章 java技术爱好者 2020-08-08 1096浏览量

  • linux集群之LVS入门和企业实战

    SH:源地址hash,相同用户的请求(ip)都使用相同的realserver进行响应,避免了选择不同realserver造成的访问内容的不同(用户cache信息),缺点是当访问的realserver宕机,会造成信息丢失。 DH:目标地址HASH,...

    文章 技术小阿哥 2017-10-30 1062浏览量

  • 阿里云基础产品技术月刊 2019年3月

    阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些...

    文章 宝惜 2019-04-11 4257浏览量

  • 思考,基于高密度闪存的存储系统未来到底是一个什么...

    (全闪存阵列和分布式存储最大的区别在于是否使用了双端口硬盘,分布式存储中如果一个节点宕机,重构时间非常长,整个系统的性能会出现大幅下滑,而全闪存阵列使用双端口硬盘,控制器故障后,仍有链路可以访问硬盘,...

    文章 知与谁同 2017-08-25 1427浏览量

  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...

    文章 阿里云App 2018-04-20 4538浏览量

  • 阿里云BaaS智能合约扫描服务使用详解

    全局变量仅存在当前的节点中,并没有存储到账本中,当有节点宕机或出现错误时,有可能会导致该全局变量在多个peer节点中不一致。最佳实践隐患 最佳实践隐患不会对智能合约的安全性产生影响,但是可能会导致异常退出...

    文章 寒风~轻扬 2019-11-05 1324浏览量

  • 《Hadoop与大数据挖掘》——第2章 大数据存储与运算...

    第二名称节点的作用在于为HDFS中的名称节点提供一个Checkpoint,它只是名称节点的一个助手节点,这也是它在社区内被认为是Checkpoint Node的原因。如图2-3所示,只有在NameNode重启时,edits才会合并到fsimage文件中...

    文章 华章计算机 2017-07-03 2125浏览量

  • 带你读《KVM实战:原理、进阶与性能调优》之一:虚拟化...

    所以,宿主机上各个客户机是由宿主机内核像调度普通进程一样调度的,即可以通过Linux的各种进程调度的手段来实现不同客户机的权限限定、优先等功能。客户机所看到的硬件设备是QEMU模拟出来的(不包括VT-d透传的...

    文章 温柔的养猫人 2019-10-31 2676浏览量

  • 阿里“去 IOE”十二年,弹性计算如何二次去 I 和 E?

    举一个例子,阿里云在服务器和接入交换机的架构上,存储、网络和云盘等都是通过网卡虚拟化出来的。服务器上的电力、网络,都是双线接入的。通过自研技术,在服务器、飞天操作系统中实现物理网络的路由切换。如果这个...

    文章 阿里云弹性计算 2020-06-30 500浏览量

  • 《企业迁云实战》——2.4 云端实践

    3)系统可用性要求极高,必须7×24小时不间断服务,没有非计划性宕机时间。通过利用阿里云的混合云方式,12306网站顺利解决了高并发、大流量的问题:1)12306把余票查询系统从后台分离出来,在“云上”独立部署了...

    文章 华章计算机 2017-09-04 1916浏览量

  • 《架构师》反思:系统可靠性

    文中以一交换机的研发做为例子,说明可靠性工程的应用,给产品带来了惊人的好处: 问题数下降、维护费用下降、测试件间隔缩短、引入新产品的间隔缩短、客户满意度提升。原因如下: ⑴把可靠性作为确定是否发行的标准...

    文章 胡庆访 2016-05-05 4750浏览量

  • 饿了么:云端调度,饭来张口

    3)高可用性挑战:众所周知,IDC自建系统运维要承担从底层硬件到上层应用的“全栈运维”运营能力与维修能力,当2015年夏天上海数据中心故障发生,主核心交换宕机时,备核心交换机Bug同时被触发,从事故发生到硬件...

    文章 田丰 2017-03-28 3781浏览量

  • 空学Kafka之一

    该参数指明了虚拟机的子系统将如何使用交换分区,而不是只把内存页从页面缓存里移除。要优先考虑减小页面缓存,而不是进行内存交换。通过设置 vm.dirty_ratio 参数可以增加被内核进程刷新到磁盘之前的脏页数量,可以...

    文章 renchie 2019-08-05 3134浏览量

  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...

    文章 华章计算机 2017-05-02 2145浏览量

  • Redis经典面试题总结

    Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复。主机宕机宕机前有部分数据未能及时同步到从机,切换IP后还会引入数据不一致的问题...

    文章 clover2837 2020-09-26 2603浏览量

  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    高可用性即在硬件出问题时保证虚拟机的正常工作,当然如果真的出错了,则只能在不同的ESXi主机上启动虚拟机,这也可能造成服务的中断。FT(容错)的主要功能就是保证在出现故障时用户的应用不会出现中断。其原理就是...

    文章 温柔的养猫人 2019-10-31 2526浏览量

  • Docker容器实战(八)-漫谈 Kubernetes 的本质

    像这样的两个应用,往往故意不部署在同一机器,即使Web应用所在的机器宕机了,数据库也不受影响。可对于一个容器来说,它的IP地址等信息是不固定的,Web应用又怎么找到数据库容器的Pod呢?所以,Kubernetes的做法是...

    文章 javaedge 2019-10-18 1195浏览量

  • 【转贴】两年内从零到每月十亿 PV 的发展来谈 ...

    集群管理算法是一个 SPOF 单点故障,如果有个 bug 影响每个节点,这可能会宕机 4 次。集群管理器编码复杂,有如下一些失败的模式: 数据重新均衡中断:当一个新机器加入然后数据开始复制,它被卡住了。你做什么工作?...

    文章 孤剑 2013-04-21 814浏览量

  • Service Mesh 高可用在企业生产中的实践

    Consul 使用 Raft 协议作为其分布式一致性协议,本身对故障节点有一定的容忍性,在单个 DataCenter 中 Consul 集群中节点的数量控制在 2*n+1 个节点,其中 n 为可容忍的宕机个数。Quorum size:Raft 协议选举...

    文章 花肉酱 2020-06-03 220浏览量

  • Docker 容器实战(八):漫谈 Kubernetes 的本质

    像这样的两个应用,往往故意不部署在同一机器,即使Web应用所在的机器宕机了,数据库也不受影响。可对于一个容器来说,它的IP地址等信息是不固定的,Web应用又怎么找到数据库容器的Pod呢?所以,Kubernetes的做法是...

    文章 迪科斯彻 2019-12-24 360浏览量

  • 如何用好云原生数据湖?

    ENI虚拟网卡:打通VPC需要配置自己账号下的安全组和虚拟交换机(VSwitch),配置之后结算节点容器会分配用户VPC对应VSwitch网段的的IP,并挂载用户的安全组。3 高吞吐网络带宽 访问OSS服务是通过高吞吐的带宽服务。...

    文章 茶什i 2020-10-26 3260浏览量

  • 让Elasticsearch飞起来!——性能优化实践干货

    数据量级达到TB+甚至更高之后,wildcard在多字段组合的情况下很容易出现卡死,甚至导致集群节点崩溃宕机的情况。后果不堪设想。替代方案: 方案一:针对精确度要求高的方案:两套分词器结合,standard和ik结合,使用...

    文章 开发者社区 2019-07-01 1842浏览量

  • 这可能是史上最全 Redis 高可用解决方案总结

    又由于 COW 机制,导致极端情况下的主库内存溢出,程序异常退出或宕机;主库节点生成备份文件导致服务器磁盘 IO 和 CPU(压缩)资源消耗;发送数 GB 大小的备份文件导致服务器出口带宽暴增,阻塞请求,建议升级到...

    文章 技术小能手 2018-09-29 2829浏览量

  • OceanBase 互联网时代的关系数据库实践

    这样做的好处是当真的某个城市故障了,或者整个城市交换机的出口异常了,我们的业务还能够继续,既不需要人工的干预,也不会有数据上的丢失。到这个阶段系统可用性是不是就非常完善了呢,其实可能还是不够的,有些...

    文章 安和林 2017-12-29 1600浏览量

  • 这可能是史上最全 Redis 高可用解决方案总结

    又由于 COW 机制,导致极端情况下的主库内存溢出,程序异常退出或宕机;主库节点生成备份文件导致服务器磁盘 IO 和 CPU(压缩)资源消耗;发送数 GB 大小的备份文件导致服务器出口带宽暴增,阻塞请求,建议升级到...

    文章 java填坑路 2018-09-30 1487浏览量

1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化