• 天梭M13为何具有大型水平的高可用性

    RAS特性是主机与一般服务器的主要区别,同时也是主机设计的一个难题,业界产品在技术上普遍具备了超过99.99%的高可用性,但是银行、保险、证券交易所等核心业务系统的宕机事件仍时有发生。100%的可靠是不存在的,但...
    文章 2017-08-02 1418浏览量
  • 消息中间件选型分析

    如果在这段时间内RabbitMQ服务节点发生宕机、重启等异常情况,消息保存还没来得及落盘,那么这些消息将会丢失。如果在Phase1中采用了事务机制或者publisher confirm机制的话,服务端的返回是在消息落盘之后执行的...
    文章 2019-04-15 1137浏览量
  • 双 11 猫晚直播:看阿里文娱如何“擒住”高并发、多...

    由于双路摄像机的流,同通过不同的编码、链路上传到云的,会存在进度不一致的问题。用户切换过程就会出现画面或声音回跳的问题,例如明星唱了一句歌词,切换后可能由于画面 回跳导致又唱了一遍,造成用户体验的...
    文章 2020-05-27 554浏览量
  • Flink最佳实践(一)流式计算系统概述

    某个比较倒霉的哥们,可能在地铁或者隧道等信号不好的场所中,数据发送的过程可能因为外部环境因素而发生意外情况(信号不好、甚至无信号)导致延迟发送甚至无法发送。在这种情况下,可能原本应该于9点发送的数据包...
    文章 2019-11-19 1770浏览量
  • PHP进程间通信探究

    比如对多进程的控制,处理不好很容易导致程序死锁,CPU内存爆表、服务器宕机。异步回调的Coding方式与PHP本身的编程思想有一定出入,驾驭不好也是灾难。当然也不能说的太吓人,在实际的项目中我们有很多场景不得不...
    文章 2016-11-17 2078浏览量
  • Unix网络编程 3rd vol1 读书笔记

    出现这个误区的原因是因为我没有理解TCP是根据socket pair区分连接,而不是根据单独的socket。2.11 缓存大小和限制 对于同步的socket(blocking socket),write函数的内部如何操作?write函数会将应用程序buffer中...
    文章 2017-09-13 761浏览量
  • 浅析HDFS架构和设计

    找到问题所在,进行修复(比如修复宕机的datanode)。或者可以手动强行退出安全模式(没有真正解决问题):hdfs namenode-safemode leave。在hdfs集群正常冷启动时,namenode也会在safemode状态下维持相当长的一段...
    文章 2019-07-18 750浏览量
  • 做存储双活是好,但不能白白浪费了存储阵列软件

    说到数据中心的故障,IDC有一个大致的统计数字,逻辑故障占53%,硬件故障占47%,这也就意味着,大多数情况下存储双活面对的问题,不是系统宕机或是站点损毁,而是数据压根儿就是错的——这往往是逻辑故障所造成的。...
    文章 2017-08-09 2371浏览量
  • 系统稳定性——So Hot?快给 CPU 降降温!

    当 CPU 过于繁忙,就像“人脑”并发处理过多的事情,会降低做事的效率,严重时甚至会导致崩溃“宕机”。因此,理解 CPU 的工作原理,合理控制负载,是保障系统稳定持续运行的重要手段。目录 CPU 的物理核与逻辑核 ...
    文章 2019-08-26 944浏览量
  • 日均请求量百亿级数据处理平台的容器云实践

    主要的问题是 FopGate 在过载时依然会崩溃,每个主机会过载出问题,造成请求变慢或者宕机。接下来讨论一下如何解决这些问题。如何应对官方数据处理的挑战 系统测量 第一,测量 FopGate 的服务能力。按照线上的配置,...
    文章 2017-05-02 1292浏览量
  • 63分59秒1000亿,如何抗住双11高并发流量?

    这是一个理想的估算,在实际的生产环境中,由于服务发布,宕机等各种各样的原因,情况肯定会比这个更差。对于一些比较敏感的业务,比如金融,或是对服务稳定要求较高的行业,比如订单或者支付业务,这样的情况是不能...
    文章 2019-11-11 885浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    在某些情况下硬件能检测错误但是无法校正,并且这些错误要对用户可见,典型如宕机崩溃。静默数据错误。此类错误既没有被硬件检测到,也没有被通知给操作系统,但是数据就是被 CPU 写到了内存,从而无法知道它是错误...
    文章 2021-07-01 3028浏览量
  • AIX的Dump文件学习笔记(原创)

    可能的原因包括:系统在进行内核操作时发生了未知的意外或者不能对其进行正常处理,都会引起DUMP。也可以由系统管理员发出命令,强制系统DUMP。当系统进行DUMP时,DUMP管理设施自动将内核相关的数据(kernel segment0...
    文章 2016-05-24 2116浏览量
  • Linux必会原理之输入网址到看到页面内容原理

    503 services unavailable 服务器不可用,可能是服务器超载或者宕机,或者反向代理后面没有提供服务的节点 504 Gateway timeout 代理向后请求,后端在一定时间内没有给反馈,造成的超时。下面看看响应头部,...
    文章 2017-11-28 1258浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-02-07 7047浏览量
  • Kubernetes-核心资源之Pod

    如果Pod所在的Node宕机,给定的Pod(即通过UID定义)不会被重新调度。相反,它将被完全相同的Pod所替代。这所说的具有和Pod相关生命周期的情况,例如存储卷,是说和Pod存在的时间一样长。如果Pod被删除,即使完全...
    文章 2018-12-14 1035浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-01-12 5712浏览量
  • 万字总结,终于有人把 Redis 持久化说明白了

    复制主要实现了数据的多备份,以及对于读操作的负载均衡和简单的故障恢复。缺陷:故障恢复无法自动化;写操作无法负载均衡;存储能力受到单机的限制。哨兵:在复制的基础上,哨兵实现了自动化的故障恢复。缺陷:写...
    文章 2020-04-11 1249浏览量
  • 独家|一文读懂Hadoop(二)HDFS(上)

    如果Namenode在文件关闭前宕机了,则该文件将丢失。上述方法是对在HDFS上运行的目标应用进行认真考虑后得到的结果。这些应用需要进行文件的流式写入。如果不采用客户端缓存,由于网络速度和网络堵塞会对吞估量造成...
    文章 2017-08-01 1475浏览量
  • 个人总结的一个中高级Java开发工程师或架构师需要掌握...

    14、redis/zk节点宕机如何处理 15、分布式集群下如何做到唯一序列号 16、如何做一个分布式锁 17、用过哪些MQ,怎么用的,和其他mq比较有什么优缺点,MQ的连接是线程安全的吗 18、MQ系统的数据如何保证不丢失 19、...
    文章 2018-11-11 2024浏览量
  • 带你读《网络防御与安全对策:原理与实践(原书第3版...

    取而代之,它首先发送SYNACK(开始握手过程的确认信号)。SYNACK包有一个精心构建的cookie,它由请求连接的客户端机器的IP地址、端口号和其他信息经过哈希算法产生。当客户端以正常ACK(确认)响应时,该响应包括...
    文章 2019-11-06 423浏览量
  • 微服务(Microservices)—Martin Flower【翻译】...

    把服务当成组件(而不是组件库)的一个主要原因是,服务可以独立部署。如果你的应用程序是由一个单独进程中的很多库组成,那么对任何一个组件的改变都将导致必须重新部署整个应用程序。但是如果你把应用程序拆分成很...
    文章 2016-05-05 4331浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之一:...

    内燃机的发明解决了交通工具的发动机问题,运输类设备迎来了巨大的发展空间。在20世纪50年代之前,设备主要依靠电力或内燃机提供动力。随着技术的改良和进步,设备效率不断提升,加工速度不断提高。但制造过程中,...
    文章 2019-11-08 1248浏览量
  • 带你读《跟老男孩学Linux运维:核心基础篇(上)(第2...

    在服务器主板上安装蓄电池,在断电后宕机前瞬间将内存数据回写到磁盘。UPS(一组蓄电池)不间断供电(IDC数据中心机房一般都会用UPS持续供电)。UPS(Uninterruptible Power System/Uninterruptible Power Supply)...
    文章 2019-11-11 1046浏览量
  • 顶会|关于数据库顶级会议 SIGMOD 2018,看这一篇就够...

    去年SIGMOD的Aurora论文侧重点在于设计理念和整体架构,而今年SIGMOD的Aurora论文侧重几个关键点的实现方案,包括写流程和宕机恢复,快照读取,如何避免读取操作访问多数派副本,以及成员变更。Aurora不需要使用两...
    文章 2018-07-10 5095浏览量
  • 阿里内核月报2015年03月

    这就等于说用户为了避免宕机而进行热升级,结果在热升级的时候用户有可能真的宕机。但是这似乎就是目前的正式状况。Ingo随后也提出了自己对于一致性模型的想法,让所有进程跑到一个一致的沉默状态,这个状态不会影响...
    文章 2017-06-07 1293浏览量
  • 我的2019校招面经大全(包含BAT头条网易等大厂面经)

    然后他问我怎么用信号量实现,并且提示可以再用一个线程。然后我说了个方案。7 问了项目 8 如何把优化递归的代码 改成尾递归或者循环。面试官说不是,引导说用栈实现递归。问我栈中需要压入哪些数据。他说应该是方法...
    文章 2019-03-13 4099浏览量
  • 阿里云专家详解 2020 服务网格发展趋势

    如果实例已经由于各种原因宕机,或者请求根本没有响应,或者由于其他任何原因而无法处理请求,服务网格组件则会根据需要在另一个实例上重试该请求,前提是它知道请求是幂等的;如果实例始终返回错误,服务网格组件会...
    文章 2020-04-08 696浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    推断异常出现的位置及原因&xff0c;并给予初步的建议解决方案&xff0c;则将对系统状态稳定起到巨大的作用。传统的时间序列数据异常检测方法通常聚焦在一维场景下&xff0c;根据不同时间点数据样本间的关联来对异常进行判断...
    文章 2021-07-06 411浏览量
  • 最全技术面试180题:阿里11面试+网易+百度+美团!

    同步复制,各节点间无延迟且节点宕机不会导致数据丢失。紧密耦合,所有节点均保持相同状态,节点间无不同数据。无需主从切换操作。无需进行读写分离。并发复制:从节点在APPLY数据时,支持并行执行,有更好的性能...
    文章 2018-11-05 1126浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化