计算机系统可靠性分析评测技术【全讲解】

简介: 计算机系统可靠性分析评测技术【全讲解】

 

目录

计算机可靠性概述

计算机可靠性模型

串联系统

并联系统

N模冗余系统


Hello,你好哇,我是灰小猿,一个超会写bug的程序猿!

今天在这里和大家记录一下关于计算机系统可靠性分析的相关技术和常用方法。同时它也是分析和评价计算机系统性能的一项重要指标,一台计算机的好坏就看它啦!

计算机可靠性概述

在一般情况下,计算机系统的硬件故障通常是由元器件的失败引起的,在对元器件进行了寿命试验并根据实际资料的统计得出:元器件的可靠性一般可以分为三个阶段:

第一阶段:即开始阶段,元器件的工作处于不稳定期,这个时候的失败率较高。

第二阶段:这个时候的元器件是进入正常工作的时期,因此相对于之前第一阶段和之后的第三阶段,失败率最低,基本保持一个常数状态,

第三阶段:在这个时候,也就是元器件使用了一段时间之后,元器件开始老化,因此失败率又重新提高,

以上三个阶段中,元器件失败率的变化曲线是处于一个先高后低再高的形式,因此对于这种变化也有一个很形象的名称叫作“浴盆曲线”,因此我们应当尽可能的保持计算机元器件处于第二阶段,在第一阶段时就应该对元器件进行老化筛选,到了第三阶段,计算机基本业绩处于了淘汰阶段。

image.gif编辑

而对于计算机系统的可靠性,则是指从它开始运行(t=0)到某时刻t这段时间能够正常运行的概率。用R(t)表示,所谓失败率,则是指单位时间内失败的元件数与元件总数的比例,用λ表示,当λ为常数时,可靠性与失败率的关系为:

image.gif编辑

两次故障之间系统能正常工作的时间的平均值称为平均无故障时间(MTBF)即:

MTBF=1/λ

通常用平均修复时间(MTRF)来表示计算机的可维修性,即计算机的维修效率,它所指的是从故障发生到机器修复平均所需要的时间,计算机的可用性指的是计算机的使用效率,它以系统在执行任务的任意时刻能正常工作的效率A来表示,即:

image.gif编辑

计算机的RAS是指用可靠性R、可用性A和可维护性S这3个指标去衡量一个计算机系统。

但其实在实际的应用过程中,引起计算机故障的原因除了必要的元器件因素以外,还有组装工艺、逻辑设计等因素,因此对于不同厂家生产的兼容机即使采用了相同的元器件,其可靠性和MTBF也是可能相差很大的。

计算机可靠性模型

我们知道计算机系统是一个非常复杂的系统,同时影响其复杂性的因素也十分的多,因此很难对齐直接进行可靠性的分析,但在计算机系统中,通过建立适当的数学模型,把大系统分割成若干子系统,就可以简化其分析过程,常见的系统可靠性数学模型有以下三种:

串联系统

假设一个系统由N个子系统构成,当且仅当所有的子系统都能正常工作时,系统才能正常工作,这种系统类似于我们物理上学习的串联电路,因此这种系统也被称为串联系统。如下图所示:

image.gif编辑

设系统中各个子系统的可靠性分别用R1,R2,...,Rn来表示,则系统的可靠性就等于这n个子系统的可靠性的乘积。

image.gif编辑

如果系统的各个子系统的失败率分别用λ1、λ2、λ3...λn来表示,则系统的失败率就等于所以子系统失败率的和。

image.gif编辑

并联系统

假如一个系统由N个子系统组成,那么只要有一个子系统能够正常工作,那么整个系统就能正常工作,这样的系统类似于电路中的并联电路,所以这种系统也被叫做并联系统,结构如下图所示:

image.gif编辑

设系统中各个子系统的可靠性分别用R1,R2,...,Rn来表示,则系统的可靠性就等于:

image.gif编辑

假如所有子系统的失败率都为λ,则系统的失败率μ为:

image.gif编辑

在这里需要注意的是:在并联系统中只有一个子系统是真正需要的,其余N-1个子系统称为冗余子系统,随着冗余子系统数量的增加,系统的平均无故障时间自然也就增加了。

N模冗余系统

N模冗余系统是由N(N=2n+1)个相同的子系统和一个表决器组成的,表决器把N个子系统中占多数相同结果的输出作为系统的输出。结构如图所示:

image.gif编辑

在N个子系统中,只要有n+1及以上个子系统能够正常工作,那么系统就能正常工作并输出正常的系统。假设表决器是完全可靠的,每个子系统的可靠性为R0,则N模冗余系统的可靠性为:

image.gif编辑

以上就是进行计算机系统可靠性分析的三种数学模型。

同时提高计算机的可靠性一般采取如下两项措施:

    1. 提高元器件的质量,改进加工工艺与工艺结构,完善电路设计
    2. 发展容错技术,使得在计算机硬件有故障的情况下,计算机仍然能够继续运行,并且得出正确的结果。

    好了,关于计算机可靠性的相关分析评测就分享到这里,之后还会对计算机系统的性能评价进行分析总结。

    觉得不错记得点赞关注哟!

    大灰狼陪你一起进步!

    image.gif编辑

    目录
    相关文章
    |
    3月前
    |
    监控 JavaScript 前端开发
    【软件设计师备考 专题 】计算机系统性能评测方式(二)
    【软件设计师备考 专题 】计算机系统性能评测方式
    52 0
    |
    3月前
    |
    搜索推荐 测试技术 Apache
    【软件设计师备考 专题 】计算机系统性能评测方式(一)
    【软件设计师备考 专题 】计算机系统性能评测方式
    59 0
    |
    2月前
    |
    存储 搜索推荐 数据管理
    计算机在商业应用中的重要性
    计算机在商业应用中的重要性
    24 0
    |
    11月前
    |
    编解码 监控 算法
    文档管理软件中的精度优化:蝶行算法的崭露头角
    蝶行算法是一种基于蝴蝶飞行的优化算法,其主要思想是模拟蝴蝶在寻找食物时的飞行路径,通过不断调整飞行方向和速度,最终找到最优解。
    223 1
    |
    负载均衡 监控 算法
    转:启发式算法对网络行为管理系统的应用研究、实用性分析及实现难度
    启发式算法在网络行为管理系统中的应用研究是一个重要的领域,它可以帮助改善系统的性能和效率。启发式算法是一种通过模拟自然界的演化过程或启发式规则来解决复杂问题的方法。
    62 2
    |
    算法
    头歌计算机算法设计与分析:随机化算法
    > 任务描述 > 相关知识 > 随机数 > 编程要求 > 测试说明
    147 0
    |
    运维 架构师 Cloud Native
    软件工程:为数十亿用户设计架构
    在过去,我们已经分享过了支付宝伴随着双十一大促一路走来的技术演进,今天,我们邀请到了支付宝全局架构师曹刚,请他给大家分享一下,给 12 亿用户设计架构是什么体验。
    软件工程:为数十亿用户设计架构
    ITDSD- 4.分布式软件的定量分析
    这是关于分布式架构新手入门的第五篇文章。这一篇文章主要介绍通过计算分布式系统中的单次请求成功率,以及重复请求的稳定率获得系统的稳定性估值。依据软件结构评估性能及其冗余。通过对系统的分析判断出潜在的性能瓶颈。
    |
    机器学习/深度学习 安全 大数据
    大数据环境下计算机软件技术分析
    随着我国信息科技的不断发展,我国社会已经逐渐迈入了信息化时代,信息化时代最主要的特征就是建立以大数据为代表的信息技术平台。大数据环境下网络信息的整合能力,信息资源的共享能力越来越强,对计算机软件技术的应用要求也越来越高。
    1132 0
    |
    缓存 监控 网络协议
    从计算机知识到落地能力,你欠缺了什么?
    本文是一个理论过度到实践的典型案例,借助程序员经常遇到的一个问题——网络为什么不通,来具体说明怎么将书本上的死知识真正变成我们解决问题的能力。
    5967 0