• 黑客与宕机

    分析 Linux 内存转储的第一步,我们使用 crash 工具打开内存转储,并用 sys 命令观察系统的基本信息宕机的直接原因。对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack ...
    文章 2020-07-17 1071浏览量
  • vmcore自动分析工具

    提取vmcore中宕机原因的特征,从而实现后续对大量的vmcore文件进行相似度分析,识别相同问题的vmcore的目标。3)考虑是否可以将机器学习引入到vmcore;将机器学习用于提取vmcore特征、训练vmcore特征匹配模型可能是...
    文章 2019-09-29 3605浏览量
  • 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1085浏览量
  • 三高Mysql-搭建“三高”架构之扩展与切换(下)

    当节点出现宕机的时候可以通过Mha进行节点的切换保证分库分表的正常工作。但是我们还发现一个问题那就是dble本身也是单点的&xff0c;所以dble也需要做集群的负载均衡防止整个节点不可用&xff0c;而对于dble的负载分发...
    文章 2022-06-23 98浏览量
  • 跑得好好的Java进程,怎么突然就瘫痪了?

    统一配置分布式系统中每台服务器限流阀值,要么发挥不出每台服务器应有的作用,要么在高qps的情况下一些比较慢的服务器宕机,所以用服务器作为限流粒度是最合适的。b.设置了正确的限流阀值,也可能被摸死 当单机承受...
    文章 2019-11-27 7395浏览量
  • 跑得好好的Java进程,怎么突然就瘫痪了?

    统一配置分布式系统中每台服务器限流阀值,要么发挥不出每台服务器应有的作用,要么在高qps的情况下一些比较慢的服务器宕机,所以用服务器作为限流粒度是最合适的。b.设置了正确的限流阀值,也可能被摸死 当单机承受...
    文章 2019-11-27 13841浏览量
  • Jira 等云产品宕机多日,这场 Atlassian 有史以来的...

    事件页面上的大多数状态更新都是复制粘贴相同的内容,这样做显然是为了每隔几个小时提供一次更新……但这些不是更新,他们增加了无法控制住宕机的感觉。避免沉默。直到第 9 天,Atlassian 一直处于静默状态。不惜...
    文章 2022-04-18 71浏览量
  • RedLock究竟是不是Redis分布式锁分布式环境下的银弹?

    我们回顾 1 观点,深究抽象出现这个缺陷的根本原因,就是为了解决由于系统宕机带来的锁失效而给锁强加了一个失效时间,异常情况下,程序(业务)执行的时间大于锁失效时间从而造成的一系列的问题,我们能否从这方面...
    文章 2020-06-29 750浏览量
  • Redis夺命连环11问

    速度快的原因主要有几点:完全基于内存操作C语言实现,优化过的数据结构,基于几种基础的数据结构,redis做了大量的优化,性能极高使用单线程,无上下文的切换成本基于非阻塞的IO多路复用机制那为什么Redis6.0之后又...
    文章 2021-03-05 1179浏览量
  • 关于分布式计算的一些概念

    系统几乎不会宕机(高可用性 99.9999999%一年只有 31 ms 宕机)。Akka虽然是Scala写成的,但是由于Scala最终还是编译为Java字节码运行在JVM上,所以我们可以认为Akka属于Java领域。Akka处理并发的方法基于Actor模型。...
    文章 2018-06-03 4246浏览量
  • 低成本和高性能MySQL云数据的架构探索

    Proxy服务器是无状态的,服务器宕机不会对系统中其他服务器造成影响,只会造成连接到该proxy的用户连接断开。多台Proxy服务器采用LVS HA方案实现负载均衡,用户应用重连后会被LVS定向到其他的proxy上。Agent服务器...
    文章 2012-12-04 1727浏览量
  • 基于 Seata Saga 设计更有弹性的金融应用

    提高异常处理灵活性:可以实现宕机恢复后的“向前重试”或“向后补偿” 天然可以使用 Actor 模型或 SEDA 架构等异步处理引擎来执行,提高整体吞吐量| 业务流程实际是由 JAVA 程序与 DSL 配置组成,程序与配置分离,...
    文章 2019-11-07 788浏览量
  • RabbitMQ灵魂九问

    消息大量堆积应该怎么处理消息堆积的原因有两个网络故障,消费者无法正常消费消费方消费后未进行ack确认解决方案如下:检查并修复消费者故障,使其正常消费编写临时程序将堆积的消息发送到容量更大的MQ集群,增加...
    文章 2021-12-24 46浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1926浏览量
  • 云原生应用和容器设计模式的综述和展望

    人们跟这些系统的关系,无非是人输入信息处理的请求意图,经过信息处理系统的处理,系统返回一个输出结果给人。如果只考虑一个系统的使用者,似乎对系统的输入者只有系统用户和系统运维,运维人员负责配置信息系统,...
    文章 2016-12-13 2587浏览量
  • IT Helpdesk的运作方式

    对于事件的升级处理,这种情况一般是对于比较复杂的问题,或者某个服务中断,如服务器宕机引起大量用户拨打热线的情况。如果是复杂的问题,我们会pass给二线的同事处理,他们不属于helpdesk team,而属于operation ...
    文章 2017-11-15 1495浏览量
  • Apache Flink 漫谈系列(02)-概述

    场景一:Flink的Source Operator 在读取到Kafla中pos=2000的数据时候,由于某种原因宕机了,这个时候Flink框架会分配一个新的节点继续读取Kafla数据,那么新的处理节点怎样处理才能保证数据处理且只被处理一次呢?...
    文章 2018-11-08 12676浏览量
  • 数据和云

    Sentinel 切换功能主要依赖 down-after-milliseconds 和failover-timeout 两个参数,down-after-milliseconds 决定了Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则决定了两...
    文章 2018-10-11 1706浏览量
  • 什么是PaaS?程序员如何在云上软件开发

    另一个PaaS的风险是,当服务供应商的基础设施因为某种原因出现了宕机,很可能也会对服务造成影响。万一供应商调整了开发策略、编程语言或是其它部分该怎么办?不要担心这些可能的困难会阻拦你加入PaaS。它为你提供了...
    文章 2017-09-04 1813浏览量
  • 什么是PaaS?程序员如何在云上软件开发

    另一个PaaS的风险是,当服务供应商的基础设施因为某种原因出现了宕机,很可能也会对服务造成影响。万一供应商调整了开发策略、编程语言或是其它部分该怎么办?不要担心这些可能的困难会阻拦你加入PaaS。它为你提供了...
    文章 2017-10-02 978浏览量
  • 扶凯:海量视频和用户时代的CDN

    并且当机器出现宕机时可在4层路由上就迅速屏蔽宕机信息。每一台机器分为两个部分:控制部分与OCT的Cache软件。控制部分进行逻辑处理以对CDN公司的海量客户控制管理和功能逻辑处理,例如请求过来以后是从路径中一部分...
    文章 2018-08-24 1439浏览量
  • 五:分布式事务一致性协议paxos的应用场景

    因为MQ本身就有排序功能,只要进了Q数据也就有了序,相当于编了全局唯一的号,无论把 这些数据写入多少个文件,只要按编号,各文件的内容必定是一致的,但一个MQ Server显然是一个单点,如果宕机,会影响整个系统的...
    文章 2016-02-22 2513浏览量
  • Kafka VS RocketMQ VS RabbitMQ

    但是一台Broker宕机后,就会产生消息乱序(来自网上,尚未找到原因) 支持顺序消费 在顺序消息场景下,消费失败时消费队列将会暂停 支持顺序消费 定时消息 不支持 开源版本仅支持定时Level 不支持 事务消息 不支持 ...
    文章 2017-09-23 3950浏览量
  • 《Spark大数据分析:核心概念、技术及实践》大数据...

    HDFS基于通常机器可能宕机这个假设而设计,所以可以处理集群中一台或多台机器的宕机问题。一个HDFS集群包含两种类型的节点:NameNode和DataNode(见图1-3)。Name-Node管理文件系统的命名空间,存储一个文件的所有元...
    文章 2017-05-19 4098浏览量
  • Go程序设计语言导读

    第5章概述函数,并讨论错误处理宕机(panic)和恢复(recover),以及defer语句。可以看出,第1~5章是基础性的,其内容是任何主流命令式语言都有的。Go的语法和风格可能与其他语言有所不同,但大多数程序员都能...
    文章 2017-05-02 2268浏览量
  • 什么是PaaS?程序员如何在云上软件开发

    另一个PaaS的风险是,当服务供应商的基础设施因为某种原因出现了宕机,很可能也会对服务造成影响。万一供应商调整了开发策略、编程语言或是其它部分该怎么办?不要担心这些可能的困难会阻拦你加入PaaS。它为你提供了...
    文章 2017-09-26 2183浏览量
  • 什么是PaaS?程序员如何在云上软件开发

    另一个PaaS的风险是,当服务供应商的基础设施因为某种原因出现了宕机,很可能也会对服务造成影响。万一供应商调整了开发策略、编程语言或是其它部分该怎么办?不要担心这些可能的困难会阻拦你加入PaaS。它为你提供了...
    文章 2017-09-19 2403浏览量
  • 架构大数据分析应用

    每一次在设备上发生了问题,公司可以预测它并避免宕机时间或利润丢失。当结合以上的使用场景的时候,根据用户的整体行为,可以使用一个预测型架构来诱惑产品目录的选择和价格。理解大数据技术生态系统 一旦确实要实施...
    文章 2016-05-18 1125浏览量
  • 我们做出了一个分布式注册中心

    这样依赖,数据迁移的粒度只能以单个data节点所存储的数据为单位,在数据量较大(单节点8G)的情况下,对数据的重建有一定的影响,而且,在data连续宕机的情况下,可能存在数据丢失或是不一致的场景。改进后的算法,...
    文章 2021-07-27 198浏览量
  • 针对云原生转型的6个关键数据策略

    单节点数据库实例不仅影响故障情况,还会影响客户端宕机事件(如版本升级)影响可用性。高可用性要求通常取决于应用程序的关键程度,但正确的数据库和云原生让解决方案的组合支持各种高可用性安装策略,适用于从内部...
    文章 2018-05-22 1254浏览量
1 2 3 4 ... 14 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化