• 《精益软件度量——实践者的观察与思考》—第1章1.2...

    本节书摘来自异步社区《精益软件度量——实践者的观察与思考》一书中的第1章1.2节度量是什么,作者张松,更多章节内容可以访问云栖社区“异步社区”公众号查看。1.2 度量是什么精益软件度量——实践者的观察与思考1...
    文章 2017-05-02 1273浏览量
  • 浅谈遗留代码的重构

    看到这条,你又开始不解了,重构是“在不改变软件可观察行为的前提下”进行的,而故障本身就是软件在特定场景下的错误行为,所以重构是改变不了故障本身的。那对高危、高频故障模块,重构的价值在哪里呢?某模块故障...
    文章 2016-07-28 3945浏览量
  • 面向失败的设计-故障与攻防演练锤炼容灾应急能力

    初期:可以选择故障覆盖率这个指标(即发生并改进过故障的系统,要能够免疫同样原因故障)。此时实验场景数就近似等同于故障覆盖率的分母。中期:可以选择监控发现率这个指标。此时实验场景数与实验次数是分母,...
    文章 2019-11-08 1348浏览量
  • 《架构师》反思:系统可靠性

    系统故障是指硬件或者软件的错误状态,一般引进故障原因是这些:部件的失效、环境的物理干扰、操作错误或不正确的设计。按照时间的长短,故障可以分为:永久性、间歇性、瞬时性。故障的级别有:逻辑级故障、数据...
    文章 2016-05-05 4907浏览量
  • 《架构师》反思:系统可靠性

    系统故障是指硬件或者软件的错误状态,一般引进故障原因是这些:部件的失效、环境的物理干扰、操作错误或不正确的设计。按照时间的长短,故障可以分为:永久性、间歇性、瞬时性。故障的级别有:逻辑级故障、数据...
    文章 2017-11-08 1017浏览量
  • 软件测试技术-测试的基本概念

    4)软件缺陷的产生原因: 技术问题,团队工作,软件本身等 5)软件缺陷的构成: 功能缺陷 系统缺陷 加工缺陷 数据缺陷 代码缺陷 4.软件测试的心理学和经济学 1)心理学 软件测试更适合被看做一个视图发现程序中错误...
    文章 2014-07-10 604浏览量
  • 《自动化测试最佳实践:来自全球的经典自动化测试案例...

    2.4 开发内部测试工具该...用这个新工具实施的某产品的首次发布测试中,要求不论何种原因,无论是产品原因或者是测试原因,至少75%的测试运行的时候不会出现故障。最后,要求至少96%的测试运行的时候不会出现故障
    文章 2017-08-02 1160浏览量
  • 预防宕机靠RAC,和力记易说那就OUT了

    预防服务器宕机,企业需要明确灾难恢复解决方案的需求,RPO(恢复点目标)和RTO(恢复时间目标)是两个常见的指标,RPO是衡量一个企业由于停机而可能损失成本数据量的度量,RTO是企业可以离线时间量的一个度量。...
    文章 2017-08-09 851浏览量
  • 软件需求工程(第2版)》一3.5 确定非功能需求

    这些问题由于缺乏定量指标,因此很难根据这些需求来评价软件系统,这也是开发出来的软件系统与用户所需的软件系统之间存在差异的主要原因。对软件系统的非功能需求有很多,此处仅列举一些用户所关心的非功能需求。...
    文章 2017-08-01 1079浏览量
  • 《分布式系统:概念与设计》一2.4.2 故障模型

    通信通道的随机故障很少,因为通信软件能识别这类故障并拒绝出错的消息。例如,可用校验和来检测损坏的消息,消息序号可用于检测不存在和重复的消息。时序故障 时序故障适用于同步分布式系统。在这样的系统中,对...
    文章 2017-08-01 1120浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    本文重点讨论数据的不丢不错故障原因,以及数据存储系统如何防控设计,不对数据库事务深入讨论。1 常见的磁盘、内存、网络数据翻转(Bit Flip)对于计算机系统来说,不管是计算还是存储,不管是电子部件还是机械部件...
    文章 2021-07-01 3062浏览量
  • 浅析单点故障以及云上高可用和容灾

    这里的可用性,我们通常用平均无故障时间来度量,可以说平均运行多长时间才会发生一次故障,也可以以平均一个周期内非故障时间与总时间的比例来表示。容灾 DR(Disaster Recovery)。字面意思是灾难恢复。在云上环境...
    文章 2017-09-27 4886浏览量
  • 容器监控的工具和流程

    本文考察了一些对于容器监控有用的软件和服务。我们已经引入了一个混合了自托管的开源解决方案以及商业的云服务的方式,以反映当前的场景。然而,重要的是要记住,与各种各样的可用的解决方案相比,我们引入的还是...
    文章 2017-10-12 2462浏览量
  • 自动化测试最佳实践 连载五

    用这个新工具实施的某产品的首次发布测试中,要求不论何种原因,无论是产品原因或者是测试原因,至少75%的测试运行的时候不会出现故障。最后,要求至少96%的测试运行的时候不会出现故障。2.5 结果 该工具经过3年的...
    文章 2017-07-10 1611浏览量
  • Software Primer

    软件可靠性是对软件在设计、开发以及所预定的环境下具有能力的置信度的一个度量,是衡量软件质量的主要参数之一。2.软件危机 软件开发周期长、成本高、质量差、维护困难,导致60年代末软件危机的爆发,其突出的实例...
    文章 2012-02-08 677浏览量
  • 从0到1建立基于大数据的质量平台

    每个数据关联起来对软件质量中的发现、度量、定位都有着重要的价值。如何从 0 到 1 建立基于大数据的质量平台,利用大数据来改善软件质量?来自阿里巴巴优酷事业部技术专家万传奇老师将在 4 月 20-22 日召开的 QCon ...
    文章 2018-03-08 12504浏览量
  • 软件设计师19-系统开发和运行02

    已管理级:软件过程和产品质量可度量,对软件过程和产品有定量的理解与控制 优化级:过程的量化反馈和先进的思想、新技术使过程持续不断改进 7 CMMI(软件能力成熟度集成模型) 初始级、可管理级、严格定义级、定量...
    文章 2018-10-29 1078浏览量
  • KubeNode:阿里巴巴云原生 容器基础设施运维实践

    进行故障分析统计,也可以分析整体 KubeNode 中的节点以及节点组件的覆盖率、一致率、节点自愈的效率,并提供针对节点的全链路诊断功能,当排查节点问题时,可以查看该节点上历史发生过的所有的事件,从而帮助用户...
    文章 2021-03-11 975浏览量
  • 一个专业网管的工作笔记(超级珍藏)

    用于纠正网络故障原因。从最象故障源处,想出处理方法每完成一个步骤,检查故障是否解决 6、观察行动计划执行结果(Observe Results) 7、如有行动计划不能解决问题,重复上述过程(Iterate as Needed) 三、记录所...
    文章 2017-11-07 1146浏览量
  • 企业Web应用中的敏捷测试和瀑布测试

    无论因为什么原因让某个环境出现故障,都要立刻让它重新工作起来。在这个话题上,敏捷和瀑布还有另外一点差异,那就是环境的计划和资源分配对它们的影响不同,尤其是当各种环境被项目之外的团队进行管理的时候,其...
    文章 2017-07-10 1438浏览量
  • 某网络专业人士笔记(超级珍藏)

    Half Troubleshooting)3、考虑可能情形(Consider Possibilities)考虑引起故障的可能原因 4、建立一份行动计划(Create the Action Plan)5、部署行动计划(Implement the Action Plan)用于纠正网络故障原因。...
    文章 2017-11-17 1208浏览量
  • 软件测试相关简要记录

    故障的含义是由错误引起的软件的不正确行为 一、估算平均无故障时间的方法 1)符号 ET——测试之前程序中错误总数 IT——程序长度(机器指令总数)τ——测试(包括调试)时间 Ed(τ)——在0至τ期间发现的错误数 Ec...
    文章 2015-06-26 1580浏览量
  • Dynatrace APM:关联环境提供数据

    帮助降低以及消除错误的警报,Dynatrace APM软件基于错误,关键事务响应能力和可用性以及多种系统度量,来设置通知。基准系统自动理解响应时间,错误率和吞吐量的统计特性,使用高级统计模型分析应用行为,最终大...
    文章 2017-07-03 1646浏览量
  • 浅谈云原生架构的 7 个原则

    这些异常通常包括硬件故障、硬件资源瓶颈(如 CPU 或网卡带宽耗尽)、业务流量超出软件设计承受能力、影响机房正常工作的故障或灾难、所依赖软件发生故障等可能造成业务不可用的潜在影响因素。​业务上线之后,在...
    文章 2021-08-13 50浏览量
  • 微服务的下一步,离不开服务网格

    开发人员可以根据与应用程序或网络相关的问题轻松排查任何问题的根本原因&xff0c;从而使他们的生活变得异常便捷。借助Service Mesh架构&xff0c;业务功能和与网络相关的功能之间的职责分工清晰。具有服务代理(Sidecar)...
    文章 2021-08-22 1278浏览量
  • DevOps:软件架构师行动指南2.2 云的特性

    其次,由于组件串行使用的故障的可能性与单个组件故障率的积相关,所以一次请求涉及的组件越多,故障的可能性就越大。我们将分别讨论这两种可能性。(1)虚拟机故障 分布式系统的架构师要做的主要决策之一是如何在...
    文章 2017-05-02 1833浏览量
  • 浅谈云原生架构的 7 个原则

    这些异常通常包括硬件故障、硬件资源瓶颈(如 CPU 或网卡带宽耗尽)、业务流量超出软件设计承受能力、影响机房正常工作的故障或灾难、所依赖软件发生故障等可能造成业务不可用的潜在影响因素。​业务上线之后,在...
    文章 2021-07-16 7528浏览量
  • 《分布式系统:概念与设计》一1.5 挑战

    当硬件或软件发生故障时,程序可能会产生不正确的结果或者在它们完成应该进行的计算之前就停止了。第2章将讨论可能在分布式系统的进程和网络中发生的故障并对其进行分类。分布式系统的故障是部分的,也就是说,有些...
    文章 2017-08-01 1160浏览量
  • 《CCNP TSHOOT(642-832)学习指南》一1.3 网络维护...

    分析用于测量网络性能的各种度量值以及性能策略进程的关键因素,以创建适合本企业的性能策略计划。1.3.1 基本的网络维护工具、应用程序及资源 目前市面上有很多可供选择的网络维护工具、应用程序及资源,这些工具及...
    文章 2017-05-02 1398浏览量
  • 阿里研究员:软件测试中的18个难题

    分析遗漏是很多故障原因。开发做系分的时候,有一个corner case没考虑到、没有处理。测试做测分的时候,忘记考虑某个特殊场景了。兼容性评估,评估下来没有兼容性问题的,但结果是有的。而且很多时候,分析遗漏...
    文章 2020-08-10 2228浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化