计算机系统可靠性分析评测技术【全讲解】

简介: 计算机系统可靠性分析评测技术【全讲解】

 

目录

计算机可靠性概述

计算机可靠性模型

串联系统

并联系统

N模冗余系统


Hello,你好哇,我是灰小猿,一个超会写bug的程序猿!

今天在这里和大家记录一下关于计算机系统可靠性分析的相关技术和常用方法。同时它也是分析和评价计算机系统性能的一项重要指标,一台计算机的好坏就看它啦!

计算机可靠性概述

在一般情况下,计算机系统的硬件故障通常是由元器件的失败引起的,在对元器件进行了寿命试验并根据实际资料的统计得出:元器件的可靠性一般可以分为三个阶段:

第一阶段:即开始阶段,元器件的工作处于不稳定期,这个时候的失败率较高。

第二阶段:这个时候的元器件是进入正常工作的时期,因此相对于之前第一阶段和之后的第三阶段,失败率最低,基本保持一个常数状态,

第三阶段:在这个时候,也就是元器件使用了一段时间之后,元器件开始老化,因此失败率又重新提高,

以上三个阶段中,元器件失败率的变化曲线是处于一个先高后低再高的形式,因此对于这种变化也有一个很形象的名称叫作“浴盆曲线”,因此我们应当尽可能的保持计算机元器件处于第二阶段,在第一阶段时就应该对元器件进行老化筛选,到了第三阶段,计算机基本业绩处于了淘汰阶段。

image.gif编辑

而对于计算机系统的可靠性,则是指从它开始运行(t=0)到某时刻t这段时间能够正常运行的概率。用R(t)表示,所谓失败率,则是指单位时间内失败的元件数与元件总数的比例,用λ表示,当λ为常数时,可靠性与失败率的关系为:

image.gif编辑

两次故障之间系统能正常工作的时间的平均值称为平均无故障时间(MTBF)即:

MTBF=1/λ

通常用平均修复时间(MTRF)来表示计算机的可维修性,即计算机的维修效率,它所指的是从故障发生到机器修复平均所需要的时间,计算机的可用性指的是计算机的使用效率,它以系统在执行任务的任意时刻能正常工作的效率A来表示,即:

image.gif编辑

计算机的RAS是指用可靠性R、可用性A和可维护性S这3个指标去衡量一个计算机系统。

但其实在实际的应用过程中,引起计算机故障的原因除了必要的元器件因素以外,还有组装工艺、逻辑设计等因素,因此对于不同厂家生产的兼容机即使采用了相同的元器件,其可靠性和MTBF也是可能相差很大的。

计算机可靠性模型

我们知道计算机系统是一个非常复杂的系统,同时影响其复杂性的因素也十分的多,因此很难对齐直接进行可靠性的分析,但在计算机系统中,通过建立适当的数学模型,把大系统分割成若干子系统,就可以简化其分析过程,常见的系统可靠性数学模型有以下三种:

串联系统

假设一个系统由N个子系统构成,当且仅当所有的子系统都能正常工作时,系统才能正常工作,这种系统类似于我们物理上学习的串联电路,因此这种系统也被称为串联系统。如下图所示:

image.gif编辑

设系统中各个子系统的可靠性分别用R1,R2,...,Rn来表示,则系统的可靠性就等于这n个子系统的可靠性的乘积。

image.gif编辑

如果系统的各个子系统的失败率分别用λ1、λ2、λ3...λn来表示,则系统的失败率就等于所以子系统失败率的和。

image.gif编辑

并联系统

假如一个系统由N个子系统组成,那么只要有一个子系统能够正常工作,那么整个系统就能正常工作,这样的系统类似于电路中的并联电路,所以这种系统也被叫做并联系统,结构如下图所示:

image.gif编辑

设系统中各个子系统的可靠性分别用R1,R2,...,Rn来表示,则系统的可靠性就等于:

image.gif编辑

假如所有子系统的失败率都为λ,则系统的失败率μ为:

image.gif编辑

在这里需要注意的是:在并联系统中只有一个子系统是真正需要的,其余N-1个子系统称为冗余子系统,随着冗余子系统数量的增加,系统的平均无故障时间自然也就增加了。

N模冗余系统

N模冗余系统是由N(N=2n+1)个相同的子系统和一个表决器组成的,表决器把N个子系统中占多数相同结果的输出作为系统的输出。结构如图所示:

image.gif编辑

在N个子系统中,只要有n+1及以上个子系统能够正常工作,那么系统就能正常工作并输出正常的系统。假设表决器是完全可靠的,每个子系统的可靠性为R0,则N模冗余系统的可靠性为:

image.gif编辑

以上就是进行计算机系统可靠性分析的三种数学模型。

同时提高计算机的可靠性一般采取如下两项措施:

    1. 提高元器件的质量,改进加工工艺与工艺结构,完善电路设计
    2. 发展容错技术,使得在计算机硬件有故障的情况下,计算机仍然能够继续运行,并且得出正确的结果。

    好了,关于计算机可靠性的相关分析评测就分享到这里,之后还会对计算机系统的性能评价进行分析总结。

    觉得不错记得点赞关注哟!

    大灰狼陪你一起进步!

    image.gif编辑

    目录
    相关文章
    |
    3月前
    |
    机器学习/深度学习 人工智能 监控
    提升软件质量的关键路径:高效测试策略与实践在软件开发的宇宙中,每一行代码都如同星辰般璀璨,而将这些星辰编织成星系的过程,则依赖于严谨而高效的测试策略。本文将引领读者探索软件测试的奥秘,揭示如何通过精心设计的测试方案,不仅提升软件的性能与稳定性,还能加速产品上市的步伐,最终实现质量与效率的双重飞跃。
    在软件工程的浩瀚星海中,测试不仅是发现缺陷的放大镜,更是保障软件质量的坚固防线。本文旨在探讨一种高效且创新的软件测试策略框架,它融合了传统方法的精髓与现代技术的突破,旨在为软件开发团队提供一套系统化、可执行性强的测试指引。我们将从测试规划的起点出发,沿着测试设计、执行、反馈再到持续优化的轨迹,逐步展开论述。每一步都强调实用性与前瞻性相结合,确保测试活动能够紧跟软件开发的步伐,及时适应变化,有效应对各种挑战。
    |
    2月前
    |
    机器学习/深度学习 IDE Java
    深入调查研究Codota
    【11月更文挑战第13天】
    33 1
    |
    6月前
    |
    网络协议 Python
    系统工程是一种跨学科的方法论,旨在通过分析和设计系统的各个组成部分、组织结构、信息流和控制机制,以实现系统的整体最优运行。
    系统工程是一种跨学科的方法论,旨在通过分析和设计系统的各个组成部分、组织结构、信息流和控制机制,以实现系统的整体最优运行。
    |
    6月前
    |
    机器学习/深度学习 算法 定位技术
    系统工程是一个跨学科的领域,它关注于如何设计、管理和优化复杂的系统。
    系统工程是一个跨学科的领域,它关注于如何设计、管理和优化复杂的系统。
    |
    8月前
    |
    机器学习/深度学习 安全 网络安全
    利用机器学习优化数据中心能效的研究数字堡垒的构建者:网络安全与信息安全的深层探索
    【5月更文挑战第29天】在云计算和大数据时代,数据中心的能效问题成为关键挑战之一。本文通过集成机器学习技术与现有数据中心管理策略,提出了一种新型的智能优化框架。该框架能够实时分析数据中心的能耗模式,并自动调整资源分配,以达到降低能耗的目的。研究结果表明,应用机器学习算法可以显著提升数据中心的能源使用效率,同时保持服务质量。
    |
    负载均衡 监控 算法
    转:启发式算法对网络行为管理系统的应用研究、实用性分析及实现难度
    启发式算法在网络行为管理系统中的应用研究是一个重要的领域,它可以帮助改善系统的性能和效率。启发式算法是一种通过模拟自然界的演化过程或启发式规则来解决复杂问题的方法。
    88 2
    ITDSD- 4.分布式软件的定量分析
    这是关于分布式架构新手入门的第五篇文章。这一篇文章主要介绍通过计算分布式系统中的单次请求成功率,以及重复请求的稳定率获得系统的稳定性估值。依据软件结构评估性能及其冗余。通过对系统的分析判断出潜在的性能瓶颈。
    12.系统可靠性分析与设计
    脑图如下所示:
    1374 0