• 微服务容错组件Hystrix设计分析

    可能会出现服务响应慢以及无法响应等问题。Hystrix是Netflix提供的一款服务容错基础组件&xff0c;通过引入它可以给原有的应用添加延迟容忍和容错逻辑&xff0c;以达到提升整个微服务架构的服务治理能力的目的。Hystrix...
    文章 2022-01-06 8浏览量
  • 轻松解决电脑死机故障攻略_软件

    只是当我们关机时间比较长时(如两三个小时,或隔夜)就又会出现上述的故障现象 这类故障的可能部位有两处: (1)主机使用的开关电源性能不良,在冷态加电工作时,虽然+5V、+12V、+3.3V电压输出正常,但其输出的PW-OK...
    文章 2017-11-07 1060浏览量
  • 《架构师》反思:系统可靠性

    一说到集群,一般会想到使用它来为应用程序提供一种可扩展的高性能设计。但是集群同时还可以为应用程序提供较高的容错能力。以下是集群的分类: 高性能计算科学集群、负载均衡集群、高可用性集群 在实际应用中,这三...
    文章 2016-05-05 4965浏览量
  • 《架构师》反思:系统可靠性

    一说到集群,一般会想到使用它来为应用程序提供一种可扩展的高性能设计。但是集群同时还可以为应用程序提供较高的容错能力。以下是集群的分类: 高性能计算科学集群、负载均衡集群、高可用性集群 在实际应用中,这三...
    文章 2017-11-08 1022浏览量
  • 【双11背后的技术】万亿交易量级下的秒级监控

    所以采用了这种架构之后,SunFire很少再遇到数据不准的问题,当出现业务故障的时候我们都可以断定监控数据是准确的,甚至秒级都可以断定是准确的,因为秒级也就是5秒为周期的任务,和分钟级没有本质区别,只是周期...
    文章 2017-01-12 5578浏览量
  • Hdfs

    但实际不然,它和元数据节点负责不同的事情,主要负责将命名空间镜像与修改日志文件周期性合并,避免文件过大,合并过后文件同步至元数据节点,同时本地保存一份,以便在出现故障时恢复。除了我们上述介绍的几种...
    文章 2022-01-18 10浏览量
  • 《工业控制网络安全技术与实践》一2.5.2 PLC的基本...

    以上两个主要原因,使得PLC的I/O响应比一般微型计算机构成的工业控制系统慢得多,其响应时间至少等于一个扫描周期一般均大于一个扫描周期甚至更长。所谓I/O 响应时间指从PLC 的某一输入信号变化开始到系统有关输出...
    文章 2017-09-07 1731浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    其次是管理体系,即团队以什么方式推动事情的运转、依托什么样的流程等,固化人在考虑问题和做事情时系统化的思维和方式。备件资源。如果将维修人员比作大厨,备件就相当于粮食和蔬菜。俗话讲:巧妇难为无米之炊。...
    文章 2019-11-08 1482浏览量
  • 稳定性思考-强弱依赖2

    另一个角度,因为响应时间变长之后,直接导致需要更多的线程数来满足不变的QPS,由于线程越多,导致对资源的持有和竞争更加激烈,表现CPU占用很高,Load很高,这是一个恶性循环,需要打破这个环。以cache访问为例 ...
    文章 2016-04-08 1386浏览量
  • 如何构建面向应用的运维管理新思维

    为了实现对应用的健康状况或者质量的度量,我们需要采集各类状态数据,从而支撑各类场景的应用,比如说监控故障发现的需求,故障恢复的需要,应用服务优化的需要等等。CMDB建设的不成功,部分是系统的原因,但更多是...
    文章 2017-08-15 1528浏览量
  • JAVA 线上故障排查完整套路!牛掰!

    首先堆外内存溢出表现就是物理常驻内存增长快,报错的话视使用方式都不确定,如果由于使用 Netty 导致的,那错误日志里可能会出现OutOfDirectMemoryError错误,如果直接是 DirectByteBuffer,那会报OutOfMemoryError...
    文章 2020-04-29 921浏览量
  • 《深入理解Hadoop(原书第2版)》——2.3Hadoop系统的...

    如果此时其访问的数据节点出现故障,就访问存放备份数据块的数据节点。3)读取数据块的时候计算该数据块的校验和,并将该校验和与写入文件时的校验和作比较。如果检验失败,则从其他数据节点获取备份数据块。...
    文章 2017-05-02 1434浏览量
  • 【系统优化】数据库系统load飙高问题解决思路

    在进行性能分析时,将所有子系统当做一个整体来看是非常重要的,因为在子系统中可能会出现瀑布效应。衡量CPU 系统负载的指标是load,load 就是对计算机系统能够承担的多少负载的度量,简单的说是进程队列的长度。简单...
    文章 2016-04-13 2040浏览量
  • 记一次dubbo服务发现导致的OOM

    对开发人员来说,这个问题主要是由于使用方没有配置protocol字段所致,所以平时在写代码的时候尽量了解参数具体的含义,否则可能会出现一些意料之外的场景。对dubbo框架而言,需要做好参数校验和防御性编程。在本次...
    文章 2020-10-30 2963浏览量
  • 带你入坑大数据(一)-HDFS基础概念篇

    如果处于高并发的情况,很容易就把机房的带宽打满,此时整一个集群的响应速度会急剧下降,这时候服务就会出现问题了。当然我们的副本数也是可以手动通过命令增加的,在客户端访问量多的时候,可以适当分配一下压力 ...
    文章 2020-07-16 494浏览量
  • Redis客户端常见异常分析

    1.客户端:高并发下连接池设置过小,出现供不应求,所以会出现上面的错误,但是正常情况下只要比默认的最大连接数(8个)多一些即可,因为正常情况下JedisPool以及Jedis的处理效率足够高。2.客户端:没有正确使用连接...
    文章 2016-11-17 1805浏览量
  • 软件开发模式:瀑布与敏捷

    整个开发持续的生命周期很长,需求和设计的时间耗费特别多,有时候会占用三分之一甚至更多时间,这样整个周期变长,大都在半年到一年左右的时间,所以更适合需求相对稳定的大项目。归纳总结 根据以上分析,...
    文章 2018-12-07 3773浏览量
  • 【系统优化】数据库系统load飙高问题解决思路

    在进行性能分析时,将所有子系统当做一个整体来看是非常重要的,因为在子系统中可能会出现瀑布效应。衡量CPU 系统负载的指标是load,load 就是对计算机系统能够承担的多少负载的度量,简单的说是进程队列的长度。简单...
    文章 2014-09-03 875浏览量
  • 一次MongoDB故障的复盘

    接下来尝试分析为何会出现主从延迟,从之前梳理的集群状态来看,除去主从延迟和local.oplog.rs的slow query,其他指标均十分健康(并不是)。一般主从延迟有以下几种可能原因: 集群节点间网络延迟(客户网络工程师...
    文章 2018-11-01 1745浏览量
  • 走进缓存的世界(一)-开篇

    在解决问题前提下,命中率高的缓存比命中率低的缓存,在硬件投入上一般会小很多,缓存数量比命中率低的缓存数量也少很多,寻址速度肯定也比较快,所以命中率高的缓存是好缓存。缓存的设计需要考虑缓存的占用空间和...
    文章 2016-08-21 885浏览量
  • 阿里巴巴 Arthas,大幅降低 OOM Trouble shooting ...

    看看线程数有没有异常,线程数正常,只是找出了资源占用比较高的线程,其中一个线程在后面其他信息统计中还会出现: YJPAgent-Telemetry ctrl-bidsearch-rank-shard1YJPAgent-RequestListenerctrl-bidsearch-rank-...
    文章 2020-07-30 979浏览量
  • 关于快照,你需要知道这6件事

    建立第一份快照后,两个快照之间只有数据变化的部分才被拷贝 手动创建一个 磁盘大小为40 GB 的快照,一般只需要几分钟的时间,具体取决于用户数据变化量。2、为什么用户需要快照?快照提供了一种便捷通用的备份...
    文章 2017-12-03 1400浏览量
  • 关于快照,你需要知道这6件事

    建立第一份快照后,两个快照之间只有数据变化的部分才被拷贝 手动创建一个 磁盘大小为40 GB 的快照,一般只需要几分钟的时间,具体取决于用户数据变化量。2、为什么用户需要快照?快照提供了一种便捷通用的备份...
    文章 2016-08-18 16912浏览量
  • 全是干货-Linux 高可用(HA)集群基本概念详解

    当主服务器出现故障时,从服务器就自动挂载数据库文件,并接替主服务器的工作。用户在未通知的情况下,通过从数据库连接到数据库文件进行操作。等主服务器的故障修复之后,又可以重新提供服务;那么,从服务器是...
    文章 2016-05-16 6214浏览量
  • Vmware vSphere常见问题汇总(五)

    由于客户的特殊需要,不需要更改虚拟机的时间,但安装vmtools后,有时候即使未打开周期性时间同步,虚拟机有时也与主机同步时间。解决方法: 1、关闭虚拟机电源。2、使用文本编辑器打开虚拟机的配置(.vmx)文件。为...
    文章 2017-11-08 2174浏览量
  • 三大linux系统对比

    首先,一旦确定了主版本,除了安全问题和严重故障会被修复以外,其他内容将不会做任何改变。这虽然对稳定性有好处,但是对许多服务不利。比如MySQL和PHP服务,它们在这五年的CentOS/RHEL主版本发布周期进行繁重...
    文章 2019-04-10 6662浏览量
  • AIX的vmstat命令详解(原创)

    po 表示每秒钟从内存置换到Paging Space的页数,无论什么时候窃取工作存储器的一页,如果它仍未驻留在调页空间中或已被修改,那它被写入调页空间。如果不被再次访问,它留在页面调度设备中直到进程终止或放弃...
    文章 2016-05-24 1842浏览量
  • LinkedIn 开源其分布式对象存储系统 Ambry

    恢复:因为系统和机器会出现宕机,磁盘上的数据也有可能会损坏,所以有必要实现恢复(recovery)的功能。在启动的时候,存储层会从最后一个已知的检查点读取log,并重建索引。恢复也有助于重建内存中的状态。Log是...
    文章 2017-07-03 1978浏览量
  • Redis(四):持久化之-AOF持久化的配置和原理

    所以这就会出现一个问题,当调用了write()函数后并不等于数据真的保存到了磁盘,但是这里又会有一个错觉,就是你再次请求该文件的时候,可以显示你最后一次更新的内容,其实这个内容并不是从磁盘上读取过来的,而是...
    文章 2017-11-10 1073浏览量
  • Hbase原理解析

    当然这里有个意外:访问的region若果在RS上发生了改变,比如被balancer迁移到其他RS上了,这个时候,通过缓存的地址访问会出现异常,在出现异常的情况下,Client需要重新走一遍上面的流程来获取新的RS地址。...
    文章 2017-09-21 869浏览量
1 2 3 4 ... 10 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化