• 两个数据访问受限的问题

    最近几天实在忙得厉害,处理了各种数据需求,有种顾及不来,而其中有一部分问题是和数据访问相关的,问题的原因很简单,但是分析问题的过程就需要很多的经验,推导,比如下面的两个案例。  第一个是开发同学反馈,...
    文章 2017-07-21 809浏览量
  • 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1027浏览量
  • 在ESXi主机上关闭无响应的虚拟

    请仔细辨别目标虚拟机的vmx父进程。第一列为进程ID(PID),第二列即为父进程ID(parent's PID)。请确保你只中止了父进程。父进程ID(PID)在每一行的第二列,在本例中都用粗体标识。请记住这个号码,它将在下面的步骤...
    文章 2017-11-05 1468浏览量
  • 给飞驰的法拉利换引擎-谈边做业务边做架构重构(1)

    重构后系统的可用性从3个9提升到4个9,重构前最夸张的一个月有4次较大的线上故障,重构后虽然也经历了机房交换机宕机、运营商线路故障、机柜断电等问题,但对业务都没有什么大的影响。我接手的第三个业务系统,是...
    文章 2016-05-12 7752浏览量
  • Chaos带你快速上手混沌工程

    这是因为流量并没有切换到没有宕机的那台机器,同时 说明我们的系统并没有失败重试的能力,或者是一开始就没有设计,或者是没有生效。通过这次故障注入,我们发现了系统的缺陷。3.2 切换至应用高可用服务控制台,在...
    文章 2021-11-15 68浏览量
  • GitLab删库300G事故敲响警钟:如何寻求专业的数据保护...

    无论用户的应用或者系统乃至数据中心发生何种意外,例如,恶意的程序破坏、文件损毁、人为误删误改、操作系统宕机、硬件故障,甚至整个机房毁于意外,在飞康CDP的全面保护下,都能最大程度地保证企业数据损失(RPO)降...
    文章 2017-07-04 2068浏览量
  • 分布式理论:CAP是三选二吗?

    现实情况 下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会 导致 Partition,因而分布式系统实现中 P 是一个必须项,而不是可选项。高可用、数据一致性是很多系统设计的目标,但是分区又是不...
    文章 2018-03-19 4155浏览量
  • 分布式理论:CAP是三选二吗?

    现实情况 下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会 导致 Partition,因而分布式系统实现中 P 是一个必须项,而不是可选项。高可用、数据一致性是很多系统设计的目标,但是分区又是不...
    文章 2018-02-07 1335浏览量
  • 应用运维——《应用智能运维实践(试读版)》

    系统故障和宕机频率快速升高&xff0c;人工运维成本飙升。著名管理咨询公司麦肯锡在名为Measuring the Net’s Growth Dividend的分析报告中指出&xff0c;2013—2025年&xff0c;互联网将帮助中国的GDP增长率提升0.3&xff5e;1....
    文章 2021-07-06 388浏览量
  • Kafka 消息丢失与消费精确一次性

    Broker端丢失数据Broker端丢失数据主要有以下几种情况:原来的Broker宕机了,却选举了一个落后Leader太多的Broker成为新的Leader,那么落后的这些消息就都丢失了,可以禁止这些“unclean”的Broker竞选成为Leader;...
    文章 2020-07-03 1004浏览量
  • 《深入分布式缓存》之“分布式理论:CAP是三选二吗?

    现实情况下我们面对的是一个不可靠的网络、有一定概率宕机的设备,这两个因素都会导致Partition,因而分布式系统实现中 P 是一个必须项,而不是可选项。高可用、数据一致性是很多系统设计的目标,但是分区又是不可...
    文章 2018-01-24 953浏览量
  • 为什么Flink会成为下一代大数据处理框架的标准?

    因此Flink较其他分布式处理的框架则会显得更加稳定,不会因为JVM GC等问题而导致整个应用宕机的问题。Save Points(保存点) 对于7*24小时运行的流式应用,数据源源不断的接入,在一段时间内应用的终止都有可能导致...
    文章 2019-09-21 1208浏览量
  • kafka实现无消息丢失与精确一次语义(exactly once)...

    并且通过消费者位移这一概念,可以让消费者在因某些原因宕机而重启后,可以轻易得回到宕机前的位置。但其实kafka的可靠性也只能说是相对的,在整条数据链条中,总有可以让数据出现丢失的情况,今天就来讨论如何避免...
    文章 2020-03-16 686浏览量
  • 关于分布式计算的一些概念

    系统几乎不会宕机(高可用性 99.9999999%一年只有 31 ms 宕机)。Akka虽然是Scala写成的,但是由于Scala最终还是编译为Java字节码运行在JVM上,所以我们可以认为Akka属于Java领域。Akka处理并发的方法基于Actor模型。...
    文章 2018-06-03 4138浏览量
  • 分布式存储系统基础

    引发服务器宕机的原因有很多,例如内存错误、服务器停电等等。服务器宕机可能随时发生,当发生宕机时,节点无法正常工作。服务器重启后,节点将失去所有的内存信息。因此,设计存储系统时需要考虑如何通过读取持久化...
    文章 2017-08-09 1649浏览量
  • 深入理解HBase的系统架构

    ZooKeeper维护服务器是否存活,是否可访问的状态并提供服务器故障/宕机的通知。ZooKeeper同时还使用一致性算法来保证服务器之间的同步。同时也负责Master选举的工作。需要注意的是要保证良好的一致性及顺利的Master...
    文章 2018-06-11 3732浏览量
  • 【OGG】OGG基础知识整理

    Extract进程利用其内在的checkpoint机制,周期性的记录其读写的位置,这种机制是 为了保证Extract进程终止或操作系统当,重新启动Extract后,GoldenGate可以恢复到之前的状态,从上一个断点继续往下运行。...
    文章 2017-07-03 2790浏览量
  • 以太坊是什么鬼?媲美比特币的加密币大揭秘

    以太坊正在如暴风般席卷世界的原因是,它是一种可分布式部署在全球的完全去中心化的计算机。了解以太坊区块链的运行原理将会揭示它如何作为一个世界级计算机来运行。以太坊是如何运行的?像任何其他的区块链一样,...
    文章 2017-10-02 1142浏览量
  • 以太坊是什么鬼?媲美比特币的加密币大揭秘

    以太坊正在如暴风般席卷世界的原因是,它是一种可分布式部署在全球的完全去中心化的计算机。了解以太坊区块链的运行原理将会揭示它如何作为一个世界级计算机来运行。以太坊是如何运行的?像任何其他的区块链一样,...
    文章 2017-09-12 1504浏览量
  • Kubernetes 实现原理

    对不能水平扩展的应用使用领导选举机制为了避免宕机,需要在运行一个活跃的应用的同时再运行一个附加的非活跃复制集让 Kubernetes 控制面板高可用,就像我在试玩环节使用的模式运行 etcd 集群运行多实例 API 服务器...
    文章 2021-12-20 18浏览量
  • 基于Redis实现DelayQueue延迟队列设计方案(附源码)

    拿来即用缺点:单机、不能持久化、宕机任务丢失等等;基于Redis自研延迟队列既然上面没有很好的解决方案,因为Redis的zset、list的特性,我们可以利用Redis来实现一个延迟队列 RedisDelayQueue设计目标实时性:允许存在...
    文章 2021-12-28 5浏览量
  • Linux环境中堆栈和堆相关内存损坏的基本原理和调试...

    利用缓冲区溢出攻击,可以导致程序运行失败、系统宕机、重新启动等后果。更为严重的是,可以利用它执行非授权指令,甚至可以取得系统特权,进而进行各种非法操作。缓冲区溢出通常是由编程错误引起的,允许用户提供比...
    文章 2017-09-13 1835浏览量
  • CAP的相对论

    有关中行IBM大型机宕机的报道link: http://digi.tech.qq.com/zt2013/syibm/ http://www.infoq.com/cn/news/2013/04/BOC-Downtime/超越CAP?Nathan Marz:How to beat the CAP theorem 2011年11月Twitter的首席...
    文章 2016-07-07 4240浏览量
  • HBase 系统架构

    在分布式系统环境中,无法避免系统出错或者宕机,一旦HRegionServer以外退出,MemStore中的内存数据就会丢失,引入HLog就是防止这种情况。工作机制: 每个HRegionServer中都会有一个HLog对象,HLog是一个实现Write ...
    文章 2017-05-02 931浏览量
  • 应用容器化和与Kubernetes适配的7条军规

    那么请确保:云原生平台和容器化应用能无缝的运行在一起,并且具备抵御故障的能力,甚至在底层的基础架构出现宕机的时候,也能通过过弹性扩展的方式表现出可靠性。本文描述了容器化应用时需要遵循的基本准则,实施...
    文章 2018-12-14 1083浏览量
  • 带你读《软件定义网络之旅:构建更智能、更快速、更...

    最常见 原因是硬件故障、操作系统故障、虚拟机管理程序故障以及因维护和升级而导致服务器宕机事件。服务器故障是偶发事件&xff0c;可以使用指数分布进行建模。服务提供商数据中心的服务器平均可用性范围为99.9%xff5e...
    文章 2021-10-18 7浏览量
  • NewSQL数据库简介

    Multi-Paxos(以下出于省略暂用 Paxos 来指代,但是实际上两者有些不一样,在本文特指Multi-Paxos)和Raft 的原理由于篇幅原因就不赘述了,简单来说,它们是高度自动化,强一致的复制算法,在某节点故障的时候,...
    文章 2017-07-28 4841浏览量
  • 这样诊断和调优,轻松与数据库"timeout"说再见

    例如,如果你尝试登录到一个远程服务器,而服务器宕机了,远程登录超时帮助你在你的机器停止尝试登录前,不用无限等待下去。这个选项的默认值为10秒。值为0表示无限等待。在SQL Server 2008中,这个选项的默认值为20...
    文章 2017-05-02 3009浏览量
  • 反应式编程探索与总结

    需要异步的原因,是为了并行的使用资源,在多个主机或同一主机多个CPU核的场景下。The main goal of Reactive Streams is to govern the exchange of stream data across an asynchronous boundary – think passing...
    文章 2019-11-25 1139浏览量
  • 企业级自动化运维工具方案设计

    自动化运维是基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发现性能超标,超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助运维...
    文章 2019-12-13 2024浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化