• 关于

    异常原则系统一般会出现什么故障

    的搜索结果
  • 如何设计高可用系统故障隔离

    减少或不要对低级别系统的依赖这个是一种依赖原则,因为高级别系统的可用性标准(可用率、性能等)一般是高用于低级别系统的,如果依赖于低级别系统,当它发生故障时,高级别系统会故障。这样本本质上是将高级将系统...

    文章 初商 2019-08-06 1000浏览量

  • 阿里搜索事业部故障快速恢复实践

    总之,故障是用来描述系统异常对用户或者自身造成影响的一个量化指标。故障一般分级别P4-P1,严重程度越来越高,故障到P2时就全集团发周知信息了。故障的定级时要考虑到业务自身的规模和迭代速度。故障级别定义...

    文章 卢占一十力 2018-03-16 2534浏览量

  • 借助混沌工程工具 ChaosBlade 构建高可用的分布式系统

    场景模拟:对 B1 注入异常故障,A 服务调用到 B1 时会出现调用失败。预期方案:系统会将 A 服务的请求路由到 B2 进行重试。blade 命令:blade c dubbo throwCustomException-exception<EXCEPTION CLASS>...

    文章 中间件小哥 2019-05-13 10164浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 构建可靠系统原则与实践

    但是实际上很多的基础的产品和系统确仍然会出现一些稳定性问题,那么如何才能构建可靠的系统呢?是不是制定非常严格而细致的规则就可以做出可靠的系统呢?航空业的教训 在回答这个问题之前,我们先来看看对于系统...

    文章 行易 2019-04-24 12555浏览量

  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    限流降级参考:对于弱依赖,一般都要配置限流或是自动降级策略,比起通过拍脑袋或是经验值来设定,倒不如通过实际的故障测试来进行微调,比如对于下游出现超时情况,就可以通过实验得出基于线程池限流到底要填写多少...

    文章 技术小能手 2017-06-19 3556浏览量

  • 如何写出健壮的代码?

    我们都知道重复的危害性,但重复时常还会出现在我们的工作中、代码中、文档中。有时重复感觉上是不得不这么做,有时你并没有意识到是在重复,有时却是因为懒惰而重复。好借好还再借不难。这句俗话在编程世界中同样也...

    文章 茶什i 2020-07-15 1621浏览量

  • 面向失败的设计-自动化运维管控

    对于大数量的变更或大量任务重试等还需要考虑限速限流的能力,避免把下游系统“打垮”,同时基于“重监控、轻管控”的原则系统也要做好变更操作的关键记录便于事后追溯,有些变更带来的影响具备较长的延时性,这时...

    文章 KB小秘书 2019-11-08 530浏览量

  • 稳定性保障6步走:高可用系统大促作战指南!

    监控监控系统一般有四项黄金指标:延时(Latency),错误(Error),流量(Traffic),饱和度(Situation),各层的关键性监控同样也可以按照这四项指标来进行归类,具体如下:表 1告警是不是每项监控都需要告警?...

    文章 开发者小助手_LS 2021-03-08 1691浏览量

  • 《架构师》反思:系统可靠性

    一说到集群,一般会想到使用它来为应用程序提供一种可扩展的高性能设计。但是集群同时还可以为应用程序提供较高的容错能力。以下是集群的分类: 高性能计算科学集群、负载均衡集群、高可用性集群 在实际应用中,这三...

    文章 胡庆访 2016-05-05 4750浏览量

  • 托管节点池助力用户构建稳定自愈的 Kubernetes 集群

    系统在运行的过程中产生不稳定性,系统垃圾、未处理告警堆积、代码 Bug 累积、未处理的边缘异常 Case、一些人为故障源、都会引发的系统 Fail,无法穷举这些不确定性进一步决定了不可能 100%的覆盖所有修复 CASE,...

    文章 阿里巴巴云原生小助手 2021-02-02 3165浏览量

  • 《软件测试价值提升之路》——3.4 随机出错

    3.4.2 解决问题的思路【一般处理原则】通常这类错误的解决思路,是提升代码质量,并为产品加上故障检测和自动恢复的能力(即检测到宕机或长时间无心跳就复位重启),而不是试图通过测试把这些缺陷都挖出来。...

    文章 华章计算机 2017-05-02 1347浏览量

  • 《R语言数据分析与挖掘实战》——第3章 数 据 探 索 3...

    在餐饮系统中的销量额数据可能出现缺失值和异常值,例如表3-1中的数据所示。分析餐饮系统日销量额数据可以发现,其中有部分数据是缺失的,但是如果数据记录和属性较多,使用人工分辨的方法就很不切合实际,所以这里...

    文章 华章计算机 2017-05-02 2261浏览量

  • 如何成为优秀的技术主管?你要做到这三点

    由于人的思维是发散性的,所以往往在产品构思的过程中会出现各种新鲜好玩的想法,这些想法可能来自领导或者产品经理自己,但是这些想法往往都是和产品核心方向不相关的,但是由于这些想法能够在当时带来诱惑,因此...

    文章 技术小能手 2019-02-27 7737浏览量

  • 异常处理原则-good

    前面谈到在编写一个方法时,声明异常属于接口的一部分,不随着具体实现而改变,但是我们知道Java允许抛出未声明的RuntimeException,那么什么情况下这样做呢?比如,下面的例子中方法f声明了FException,但是它的...

    文章 developerguy 2016-12-28 762浏览量

  • 深入理解java异常处理机制

    这些异常发生时,Java虚拟机(JVM)一般会选择线程终止。这些错误表示故障发生于虚拟机自身、或者发生在虚拟机试图执行应用时,如Java虚拟机运行错误(Virtual MachineError)、类定义错误(NoClassDefFoundError)...

    文章 无名公子 2014-09-17 1418浏览量

  • 如何健壮你的后端服务?

    我们一开始选择消息同步的方式,因为实时性更高,但是之后就遭遇到消息迟迟发送不过来的问题,而且也没什么异常,等我们发现一天时间已过去,问题已然升级为故障。合理的方式应该两个同步方案都使用,消息方式用于...

    文章 力君 2015-12-04 5399浏览量

  • 《LoadRunner性能测试巧匠训练营》——1.4 性能测试...

    例如,在正常负载情况下,某些功能可以正常使用或者出错的概率比较低,但在压力测试下可能很快就会出现,帮助我们提早发现性能问题。小白想起,公司之前有个网站,在用户少的时候没有什么问题,但在用户多时就暴露出...

    文章 华章计算机 2017-07-03 958浏览量

  • 为了30分钟配送,盒马工程师都有哪些“神操作”?

    回滚是系统发布后出现异常最有效的止血方案,对于弱依赖我们通过柔性可用性让它跳过不阻塞继续往下走,当出现异常case时比如履约和配的状态不一致我们通过阿波罗后台进行一键修复,异常紧急订正预案、Diamond命令...

    文章 技术小能手 2019-03-19 5554浏览量

  • 万亿级数据洪峰下的分布式消息引擎

    对于前者,通过运维管控系统推送应用自身QoS数据,一般会输出如下表格。而引擎组件的服务QoS,如服务于消息问题追溯的链路轨迹组件,对于核心功能来说,定级相对较低,可在洪峰到来之前提前关闭。谈到熔断,不得不提...

    文章 中间件小哥 2017-02-07 6940浏览量

  • 什么是微服务

    可能会出现的情况是,A服务调用了B服务,B服务有调用了C服务,C服务报错了,我们定位到C服务,发现是B服务的问题,再去定位B服务,发现是A服务的问题,在去寻找A服务,如果我们每个服务的数量,不是1,是2,是5,是...

    文章 王振威 2018-07-25 928浏览量

  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    对于前者,通过运维管控系统推送应用自身QoS数据,一般会输出如下表格。而引擎组件的服务QoS,如服务于消息问题追溯的链路轨迹组件,对于核心功能来说,定级相对较低,可在洪峰到来之前提前关闭。谈到熔断,不得不提...

    文章 云木西 2017-01-12 5676浏览量

  • 微服务架构下的事务一致性保证

    重试操作一般会指定重试次数上线,如果重试次数达到了上限就不再进行重试了。这个时候应该通过一种手段通知相关人员进行处理。对于等待重试的策略如果重试时仍然错误,可逐渐增加等待的时间,直到达到一个上限后,以...

    文章 jurassic_1 2016-12-09 17787浏览量

  • 最新干货!如何深入集群调度与管理?

    针对异常做架构层面支持,例如定义整个系统异常事件,当出现异常的时候,相应异常订阅处理模块就可以快速感知,并执行异常处理。数据中心架构设计的多个考量方面架构设计是一个很大的话题。我的理解是,一定需要...

    文章 弹性计算@百晓生 2021-04-23 330浏览量

  • 2020年SpringCloud 必知的18道面试题

    Hystrix是一个延迟和容错库,旨在隔离远程系统,服务和第三方库的访问点,当出现故障是不可避免的故障时,停止级联故障并在复杂的分布式系统中实现弹性。通常对于使用微服务架构开发的系统,涉及到许多微服务。这些...

    文章 程序员白楠楠 2020-11-12 2018浏览量

  • 分布式事务一致性"看这一篇就够了

    重试操作一般会指定重试次数上线,如果重试次数达到了上限就不再进行重试了。这个时候应该通过一种手段通知相关人员进行处理。对于等待重试的策略如果重试时仍然错误,可逐渐增加等待的时间,直到达到一个上限后,以...

    文章 技术小能手 2018-04-17 10459浏览量

  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    区分责任,当出现故障时,区分清楚责任,到底是稳定性工作没有做到位,还是做到位了,但是团队同学疏忽了,还是说只是单纯的业务变化;1.3,开发和SRE的区别 都是做技术的,很多开发刚刚转向负责稳定性时,有些弯转...

    文章 茶什i 2020-10-26 3262浏览量

  • 阿里云弹性计算研发团队如何从0到1自建SRE体系

    可参考以下思路:在设计阶段时定义该依赖的性质,是强依赖还是弱依赖对方提供的SLO/SLA是什么,依赖方可能会出现什么问题以及对我们服务的影响是什么?如果依赖方出现了预期/非预期的异常,我们的策略是什么?如何...

    文章 弹性计算@百晓生 2021-06-08 505浏览量

  • 谈谈性能测试分类

    压力测试(强度测试)(Stress Test)压力测试方法测试系统在一定饱和状态下,例如cpu、内存在饱和使用情况下,系统能够处理的会话能力,以及系统是否会出现错误 特点:1、这种性能测试方法的主要目的是检查系统处于...

    文章 青衫无名 2017-07-03 1157浏览量

  • 稳定性思考-强弱依赖2

    对于APP来说,此时应该是减少对cache的访问量,让少量的线程去试探是否恢复,而不是所有线程都堵塞在这里,原则上来说不管对什么资源的访问,都不能出现大量线程堵塞的情况。最佳的做法是,限制对cache访问请求的...

    文章 中间件小哥 2016-04-08 1367浏览量

  • 地图采集车的那些事|载车篇

    若发电机功率不够或刚刚好,在汽车发电机老化和夏天高温输出效率降低的情况下,用电短缺的情况特别突出,严重情况下会出现系统设备重启等现象,影响作业。日系车辆发电机输出功率一般较低,选车时要特别注意。汽车...

    文章 高德技术小哥 2021-04-25 199浏览量

1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化