• 事件管理决定一个网管软件的成功与失败

    当一个服务器宕机后,如果在1个小时内没有恢复的话,很多网管软件会每隔几分钟就不间断的发出短信告警,但实际上运维人员已经在处理故障了,因此摩卡软件根据这个特点,实行了故障事件压缩处理,当故障事件产生后,...
    文章 2017-11-23 918浏览量
  • 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1027浏览量
  • 十大虚拟化最佳实践(转自Wes Miller的文章)

    如果虚拟机在部署时并未让适当的团队成员知道,这就意味着新系统有可能成为新零日漏洞的可恶来源,造成网络中其他关键业务系统的宕机。虚拟系统应该得到充分认识,也不能想当然。必须像对实际的物理系统一样,对虚拟...
    文章 2017-11-08 1207浏览量
  • 沉睡之狮DBMS已经醒来

    如果IT交付的正常运行时间是4个9(可正常运行时间为99.99%),每年的宕机时间在1小时内,高管们会对此非常满意。如今,一些组织正视图将正常运行时间扩展到9个9,这意味着每年的宕机时间在毫秒级别。最终,传统系统会...
    文章 2017-07-03 988浏览量
  • Dubbo设计思想

    图中的 Consumer 和 Provider 是抽象概念,只是想让看图者更直观的了解哪些类分属于客户端与服务器端,不用 Client 和 Server 的原因是 Dubbo 在很多场景下都使用 Provider,Consumer,Registry,Monitor 划分逻辑拓扑...
    文章 2021-12-20 69浏览量
  • 带你读《HBase原理与实践》之一:HBase概述

    因为稳定性的原因,并不建议在生产线上使用1.0.0~1.1.2中间的版本。目前,HBase社区推荐使用的稳定版本为1.4.10。2.x版本是接下来最受期待的一个版本(升级要慎重,请参考社区中的实践),因为最近一两年社区开发的...
    文章 2019-11-01 3761浏览量
  • 阿里云专访Redisson作者Rui Gu:构建开源企业级Redis...

    这样的设计虽然可以很大程度上避免客户端程序宕机或业务节点挂掉造成的影响,但是随之带来的弊端是遇到服务端Redis进程宕机或节点挂掉的情况,还是有可能会造成锁的信息丢失,这样的缺陷显然无法满足某些特定场景...
    文章 2018-06-25 10442浏览量
  • MySQL 入门(1):查询和更新的内部实现

    当设置参数为2时,则在事务提交时只做 write 操作,只保证将redo log buffer写到系统的页面缓存中,不进行fsync操作,因此如果MySQL数据库宕机时,不会丢失事务,但操作系统宕机则可能丢失事务。当设置参数为0时,...
    文章 2020-04-30 293浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1874浏览量
  • 《深入分布式缓存》之“分布式理论:CAP是三选二吗?

    现实情况下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会导致Partition,因而分布式系统实现中 P 是一个必须项,而不是可选项。高可用、数据一致性是很多系统设计的目标,但是分区又是不可...
    文章 2018-01-24 953浏览量
  • 没有宫廷内斗,数据库界的延禧攻略

    通常没说明指的都是异步,即主库执行完 Commit 后,在主库写入 Binlog 日志后即可成功返回客户端,无需等 Binlog 日志传送给从库,一旦主库宕机,有可能会丢失日志。半同步复制: MySQL5.5 版本之后引入了半同步复制...
    文章 2018-08-28 2257浏览量
  • MySQL数据恢复的九把瑞士军刀

    做DBA的朋友可能都遇到过MySQL数据损坏或丢失的问题,比如忘加where条件的update、delete语句,或者MySQL服务器异常宕机导致数据文件损坏等。本文针对在日常运维中由于误操作、数据文件损坏、硬盘损坏、备份失效等...
    文章 2017-05-17 1974浏览量
  • 读《大型网站技术架构》

    2)服务器越多,宕机的概率越大 常用的分布式方案: 1)分布式应用和服务;2)分布式静态资源;3)分布式数据和存储;4)分布式计算;5)分布式配置、分布式锁、分布式文件系统。集群,即多台服务器部署相同的应用,...
    文章 2017-04-09 986浏览量
  • Redis经典面试题总结

    Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复。主机宕机宕机前有部分数据未能及时同步到从机,切换IP后还会引入数据不一致的问题...
    文章 2020-09-26 5550浏览量
  • Redis非关系数据库

    Redis速度快的原因:基于内存、单线程、多路复用。2.Redis数据结构 Redis中提供了五种数据结构,分别是String、Hash、List、Set、ZSet,每种数据结构底层都是通过字符串来进行实现。2.1 StringKey对应的Value是一个...
    文章 2019-04-19 1303浏览量
  • 为何Redis要比Memcached好用

    Replication 可用于实现高可用的cache系统,允许某些服务器宕机的情况下也能提供不间断的服务。假设要求在某台缓存服务器崩溃时,只有少部分用户和程序在短时间内受影响,大多数情况下就需要有一个行之有效的解决方案,...
    文章 2014-10-30 931浏览量
  • CAP的相对论(下)

    有关中行IBM大型机宕机的报道link&xff1a;http://digi.tech.qq.com/zt2013/syibm/http://www.infoq.com/cn/news/2013/04/BOC-Downtime/超越CAP&xff1f;Nathan Marz&xff1a;How to beat the CAP theorem2011年11月...
    文章 2022-01-21 1浏览量
  • Java高质量面试总结

    说说最有成就感的一项任务深入考察的技术点:Java框架:Spring源码的AOP和IOCJDK:ConcurrentHashMap如何提高并发度NIO的原理,包括零拷贝,堆外内存以及优缺点虚拟:包冲突,类冲突的形成原理以及解办法,可以引申到JDK 9...
    文章 2021-11-28 24浏览量
  • 《Spark大数据分析:核心概念、技术及实践》大数据...

    HDFS基于通常机器可能宕机这个假设而设计,所以可以处理集群中一台或多台机器的宕机问题。一个HDFS集群包含两种类型的节点:NameNode和DataNode(见图1-3)。Name-Node管理文件系统的命名空间,存储一个文件的所有元...
    文章 2017-05-19 3992浏览量
  • 作为数据库核心成员,如何让淘宝不卡顿?

    极好的应对了服务器宕机的场景。很好的支持后期服务器扩容。在引入虚拟节点后:能很好的平衡各节点的数据分布。由于一致性哈希算法的优势,此算法几乎是所有分布式场景下使用的方案,包括mysql的分布式、redis的分布...
    文章 2020-09-24 4531浏览量
  • CAP的相对论

    有关中行IBM大型机宕机的报道link: http://digi.tech.qq.com/zt2013/syibm/ http://www.infoq.com/cn/news/2013/04/BOC-Downtime/超越CAP?Nathan Marz:How to beat the CAP theorem 2011年11月Twitter的首席...
    文章 2016-07-07 4240浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    allkeys-lru:根据 LRU 算法删除键,不管数据有没有设置超时属性,直到腾出足够空间为止。allkeys-random:随机删除所有键,知道腾出足够空间为止。volatitle-random:随机删除过期键,知道腾出足够空间为止。...
    文章 2020-12-30 245浏览量
  • Redis 21问,你接得住不?

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2021-11-04 19浏览量
  • Redis 21问,你接得住不?

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2021-11-05 15浏览量
  • Redis常见知识点汇总 也许你能用到

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2019-11-20 1635浏览量
  • HBase内部结构

    WAL是设计来解决宕机之后的操作恢复问题的,数据到达region的时候先写入WAL,然后在被加载到MemStore,就算 Region的机器当掉了,由于WAL已经存在HDFS上了,所以数据不会丢失 WAL可以关闭,默认是开启的,但是最好别这样,...
    文章 2018-12-06 1420浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    与此同时,在一些对高可靠、高可用要求极为苛刻的场景下,中间件团队又重点推出了基于多副本机制的高可用解决方案,能够动态识别机器宕机、机房断网等灾难场景,自动实现主备切换。整个切换过程对用户透明,运维开发...
    文章 2017-02-07 7210浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之一:...

    内燃机的发明解决了交通工具的发动机问题,运输类设备迎来了巨大的发展空间。在20世纪50年代之前,设备主要依靠电力或内燃机提供动力。随着技术的改良和进步,设备效率不断提升,加工速度不断提高。但制造过程中,...
    文章 2019-11-08 1584浏览量
  • 深刻理解HDFS工作机制

    磁盘元数据镜像文件是内存元数据的镜像,保存在namenode工作目录中,它是一个准元数据,作用是在namenode宕机时能够快速较准确的恢复元数据。称为fsimage。数据操作日志文件是用来记录元数据操作的,在每次改动元...
    文章 2017-08-01 932浏览量
  • 浅析HDFS架构和设计

    找到问题所在,进行修复(比如修复宕机的datanode)。或者可以手动强行退出安全模式(没有真正解决问题):hdfs namenode-safemode leave。在hdfs集群正常冷启动时,namenode也会在safemode状态下维持相当长的一段...
    文章 2019-07-18 770浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化