• namenode磁盘满引发recover edits文件报错

    又发现集群Secondary namenode 服务也恰恰坏掉,导致所有的操作log持续写入edits.new 文件,等集群宕机的时候文件大小已经达到了丧心病狂的70G+.重启集群报错 加载edits文件失败。分析加载文件报错原因是磁盘不足...
    文章 2015-01-31 824浏览量
  • ...head><meta http-equiv="Cont

    又发现集群Secondary namenode 服务也恰恰坏掉,导致所有的操作log持续写入edits.new 文件,等集群宕机的时候文件大小已经达到了丧心病狂的70G+.重启集群报错 加载edits文件失败。分析加载文件报错原因是磁盘不足...
    文章 1970-01-01 576浏览量
  • 自己动手写SQL执行引擎

    笔者这里只是完成了最简单的B+树结构,没有给其添加并发修改的锁机制,也没有在B+树做操作的时候记录log来保证B+树在宕机等灾难性情况下的一致性,所以就算完成了这么多的工作量,距离一个高并发高可用的bptree还有...
    文章 2020-05-24 488浏览量
  • 阿里基础设施的智能监控

    此外同一个安全域内不同采集域可以互相指定为备份采集域,如果某个采集域内的所有采集机都宕机,那么备份采集域的采集机会承担宕机的采集域所承担设备的采集任务,这个称之为跨采集域容灾。Syslog和AAA日志采集是由...
    文章 2019-07-30 1175浏览量
  • MySQL 入门(1):查询和更新的内部实现

    当设置参数为2时,则在事务提交时只做 write 操作,只保证将redo log buffer写到系统的页面缓存中,不进行fsync操作,因此如果MySQL数据宕机时,不会丢失事务,但操作系统宕机则可能丢失事务。当设置参数为0时,...
    文章 2020-04-30 270浏览量
  • 分布式理论:CAP是三选二吗?

    现实情况 下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会 导致 Partition,因而分布式系统实现中 P 是一个必须,而不是可选项。高可用、数据一致性是很多系统设计的目标,但是分区又是不...
    文章 2018-03-19 4034浏览量
  • Redis和编程语言的纠缠

    缓存雪崩就是指缓存由于某些原因(比如 宕机、cache服务挂了或者不响应)整体crash掉了,导致大量请求到达后端数据库,从而导致数据库崩溃,整个系统崩溃,发生灾难,也就是上面提到的缓存击穿 如何避免雪崩: 1、给...
    文章 2018-11-11 995浏览量
  • Redis真的那么好用吗?

    缓存雪崩缓存雪崩就是指缓存由于某些原因(比如 宕机、cache服务挂了或者不响应)整体crash掉了,导致大量请求到达后端数据库,从而导致数据库崩溃,整个系统崩溃,发生灾难,也就是上面提到的缓存击穿 图片来源自...
    文章 2018-10-30 2065浏览量
  • 轻松搞定RocketMQ入门

    FLUSH_SLAVE_TIMEOUT:消息发送成功,但是服务器同步到 Slave 时超时,消息已经进入服务器队列,只有此时服务器宕机,消息才会丢失 SLAVE_NOT_AVAILABLE:消息发送成功,但是此时 slave 不可用,消息已经进入服务器...
    文章 2018-08-10 28715浏览量
  • 开源AIOps数据中台搭建

    SLA表示客户与服务商之间服务可用性的承诺,一般以服务可用性用时长为维度,例如99.99%可用,表示一个周期(例如一个月)宕机的总体时间不超过0.01%*365天<4.5分钟。有时也表示API错误率占比。IT运维挑战 但是IT...
    文章 2019-12-31 5504浏览量
  • 【独家】一文读懂关系型数据库(NoSQL)

    在分布式应用中,可能因为一些分布式的原因导致系统无法正常运转。好的分区容错性要求能够使应用虽然是一个分布式系统,但看上去却好像是一个可以运转正常的整体。比如现在的分布式系统中有某一个或者几个机器掉了...
    文章 2017-05-01 1839浏览量
  • 时序数据库技术和架构演进

    其次,如果发生宕机,那么在Startup阶段,就需要重新扫描所有的TSM文件,并在内存中重新排列这些索引。正是因为上述问题,使得索引对于资源的消耗过高,所以在1.3版本之后,InfluxDB实现了基于磁盘的索引。虽然这样...
    文章 2019-03-06 5620浏览量
  • 中国移动苏州研发中心消息队列高可用设计之谈|...

    仅仅在客户端维护一个本地缓存还不够,因为如果集群中的 Leader 节点出现了宕机的故障时,集群会发生重新选举,那么客户端缓存的 Leader 节点信息就会过期,这就需要客户端就能够感知到 Leader 节点的变化。...
    文章 2019-08-14 6194浏览量
  • Everything you should know about etcd

    etcd的高可用容许少于一半个节点宕机,当宕机的是少量节点的时候,如果节点网络、存储等基础物理资源不存在问题,那么只需要修改-initial-cluster-state的状态改为existing,并重启etcd即可。但是这种可能性是非常小...
    文章 2018-01-21 4468浏览量
  • 云栖科技评论第70期:数字时代需要双螺旋

    原本不是为了这一领域设计的NVIDIA产品只能提供“人工智能计算”的能力,而真正的自动驾驶能力,这正是特斯拉自研AI芯片的原因:这是一款专门面向自动驾驶需求设计的AI芯片,为了自动驾驶的复杂场景和实际需要进行...
    文章 2018-08-13 2384浏览量
  • 全网最全95道MongoDB面试题1万字详细解析

    从备份数据库声明主数据宕机到选出一个备份数据库作为新的主数据库将花费10到30秒时间。这期间在主数据库上的操作将会失败-包括 写入和强一致性读取(strong consistent read)操作。然而,你还能在第二数据库上执行...
    文章 2020-06-11 796浏览量
  • [重磅]清华大数据产业联合会"应用创新"系列第1讲:大...

    我们要处理结构化的数据,和非结构化的数据,我们把这两个数据的分析结合起来,才能够得到比较信任的分析的结果。这就是在大数据时代我们对于数据分析采取的一种方法。这是陈毅新教授在中关村大数据产业联盟搞的一百...
    文章 2017-05-02 1500浏览量
  • Cassandra 在 360 的实践与改进

    ❷ Cassandra 使用最终一致性策略,而 HBase 的强一致性策略,配合读写策略的处理,Cassandra 可以在确保数据安全性、可靠性、一致性的前提下,出现节点宕机而不需要恢复时间,集群读写不产生任何停顿,而此场景下...
    文章 2019-12-30 294浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2016-05-05 4750浏览量
  • CAP的相对论

    有关中行IBM大型机宕机的报道link: http://digi.tech.qq.com/zt2013/syibm/ http://www.infoq.com/cn/news/2013/04/BOC-Downtime/超越CAP?Nathan Marz:How to beat the CAP theorem 2011年11月Twitter的首席...
    文章 2016-07-07 4140浏览量
  • 如何正确使用缓存?

    但是,因为是异步更新数据库,数据一致性的保障就会变弱,如果更新数据库失败则会永远的造成系统脏数据,需要很精细设计系统重试的策略,另外如果异步服务宕机的话,还要考虑更新的数据如何持久化,服务重启后能够...
    文章 2019-11-25 1870浏览量
  • 响应速度不给力?解锁正确缓存姿势

    但是,因为是异步更新数据库,数据一致性的保障就会变弱,如果更新数据库失败则会永远的造成系统脏数据,需要很精细设计系统重试的策略,另外如果异步服务宕机的话,还要考虑更新的数据如何持久化,服务重启后能够...
    文章 2019-12-09 891浏览量
  • 阿里云InfluxDB® Raft HybridStorage实现方案

    但如果真的发生单节点宕机太长,正常节点的日志文件已出现被清理而不足故障节点追取数据时,我们将利用InfluxDB的backup和restore工具,将落后节点还原至被Raft日志涵盖的较新的状态,然后再做追取。在我们的场景下...
    文章 2019-07-09 14329浏览量
  • 阿里HBase超详实践总结|一文读懂大数据时代的结构化...

    所以,这些资源的链路解耦成为我们的工作,同时,也好好对数据复制的宕机恢复速度进行了优化。数据的一致性今天,大多数生产系统会使用异步方式去实现集群间的数据复制,因为这样效率更高、逻辑更清晰。这意味着,...
    文章 2017-06-20 4460浏览量
  • 数据时代的结构化存储—HBase在阿里的应用实践

    所以,这些资源的链路解耦成为我们的工作,同时,也好好对数据复制的宕机恢复速度进行了优化。数据的一致性 今天,大多数生产系统会使用异步方式去实现集群间的数据复制,因为这样效率更高、逻辑更清晰。这意味着,...
    文章 2017-02-21 10438浏览量
  • 深入探索Redis的五种基础数据类型

    速度快的原因这里简单说一下,第一是因为数据存储在内存中,我们知道机器访问内存的速度是远远大于访问磁盘的,其次是Redis采用单线程的架构,避免了上下文的切换和多线程带来的竞争,也就不存在加锁释放锁的操作,...
    文章 2021-01-17 232浏览量
  • 干货篇|阿里云RPA如何帮助创业型公司解决企业内耗(上...

    RPA机器人能够模仿大多数人类用户的行为,比如可以登录应用程序,移动文件和文件夹,复制和粘贴数据,填写表单,从文档中提取结构化和半结构数据,抓取并执行浏览器控件等等。4)不会影响企业现有IT系统的功能与...
    文章 2020-04-24 3234浏览量
  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    在明白绝大部分原因的基础上,这里已经提出了问题并初步分析了问题,那么继续来如何解决这些问题,或者说将问题的概率降低到非常低的程度(因为没有百分百的高可用性环境,我们只是要尽量去做到它尽量完美,亚马逊的...
    文章 2011-04-29 1860浏览量
  • 阿里云RPA(机器人流程自动化)干货系列之一:认识RPA...

    RPA机器人能够模仿大多数人类用户的行为,比如可以登录应用程序,移动文件和文件夹,复制和粘贴数据,填写表单,从文档中提取结构化和半结构数据,抓取并执行浏览器控件等等。4)不会影响企业现有IT系统的功能与...
    文章 2019-03-12 14614浏览量
  • 云栖PPT下载|开源界大咖集体现身,开源数据库专场重点...

    下图是典型的DRDS部署拓扑,图左侧分为两层,Server层包含多个无状态的DRDS节点,DRDS节点向Load Balancer汇报心跳,如果出现宕机,Load Balancer就会将流量迁移到其他节点上,保证集群高可用。存储层可能使用RDS、...
    文章 2019-10-17 2106浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化