基于缺陷的测试过程有效性评价方法研究

简介:

开发过程的质量决定了软件的质量,软件测试过程的质量同样决定了软件测试的质量和有效性。软件测试在软件质量的保证环节起着至关重要的作用,在文献中定义了软件评价过程模型,这是国际上共同遵守的软件评测过程标准。但是在软件测试过程中,测试用例的设计、测试执行过程中的人员都对测试结果有很大的影响。如何约束这些可变因素,量化测试过程的有效性,辅助改善测试过程、使测试过程变得更为有效,是目前软件测试过程中有待解决的问题。针对上述问题,本文提出了一种基于缺陷驱动的测试过程有效性的评价方法,该方法通过统计系统上线后一定周期内(建议统计时间高于3个月,小于12个月)客户反馈的系统缺陷数结合测试过程中发现的缺陷数进行测试执行过程和测试用例设计过程的评价,从而达到对测试过程有效性评 价的目的。

  1、 软件测试过程及相关评价方法

  1.1 软件测试过程

  软件测试是一个为了找出错误而执行程序/系统的过程。它强调软件测试是一个找错的过程,而不仅仅证明系统是可以运行的过程。软件测试过程包括了计划、执行、检查、改进,其主要具备了可重复性、可再现性、公正性和客观性等特性。

  1.2 缺陷探测率

  缺陷探测率(Defect Detetion Percentage,缩写 DDP),是衡量测试工作效率的软件成本的重要指标之一。计算方法如下:

  其中,Bugstester是软件测试过程中发现的错误数,Bugscutomer是客户方发现并反馈给技术支持人员并进行修复的错误数。DDP越高,说明测试过程中发现的问题数量越多,发布后客户发现的问题越少,这样就降低了外部故障不一致的成本,测试过程有效性高。

  1.3 六西格玛质量评价方法

  σ(西格玛)是希腊文的字母,在统计学中称为标准差,用来表示数据的分散程度。六西格玛是由GE从一种全面质量管理方法演变成为一个高度有效的企业流程设计、改善和优化的技术,并提供了一系列同等地适用于设计、生产和服务的新产品开发工具。在软件质量评价方面,六西格玛方法也得到了广泛的应用。六西格玛改进的标准流程(DMAIC)分为定义、测量、分析、改进和控制五个阶段。其中西格玛水平与软件质量评价如下表:

▲表1 西格玛水平业绩

  由于任何检验、验证手段都不可能发现并排除所有缺陷,因此测试过程的有效性达应用六西格玛的99.997%,那么测试过程就是可信的、有效的。

  2、基于缺陷驱动的软件测试过程有效性效性评价方法

  2.1 测试执行过程缺陷遗漏率

  测试执行过程的好坏主要有测试计划、测试执行过程和测试记录等阶段决定。在测试执行过程中,完全的测试是不可能的,测试需要终止。因此在测试过程中,能够发现全部的缺陷是不可能的,必然会有一部分遗漏。从而将一些问题暴露给用户,从而影响用户的满意度、易用性。但是在测试过程中评价一个测试过程的有效性是很困难的,但是通过一段时间的系统上线应用,统计用户反馈缺陷数目,进而比较容易评价测试过程的有效性,就如同2.2节中缺陷探测率的方法。但是缺陷探测率的评价方法仅仅只是通过缺陷数目来决定测试过程的好与坏,这仅仅停留在测试结果的评价阶段,却没有覆盖的整个测试过程。因此在缺陷探测率的基础之上,本文提出一个测试执行过程缺陷遗漏率(Test-Process Lose Defect Percentage,缩写PLDP)的概念。同时在这之上加入了缺陷严重程度的约束条件。其中缺陷严重程度大体分为如下:

  严重程度1(致命的):软件产品在正常运行环境下无法继续为用户提供服务,并无其他工作方式满足同样功能,或者软件产品失效后造成人身伤害或者危机人身安全。

  严重程度2(严重的):极大的影响软件产品提供给用户的服务,或者严重影响系统要求或基本功能的使用。

 严重程度3(一般的):软件产品功能需要增强或者存在缺陷,但是存在对应的补救方法解决。

  严重程度4(轻微的):细小的问题,不需要补救方法或者功能增强,或者操作不方便,容易导致用户误操作。

  不用缺陷严重程度,将其定义为不同的权重值分别为w1=5代表严重程度1、w2=3代表严重程度2、w3=2代表严重程度3和w4=1代表严重程度4。按照缺陷严重程度计算出带有缺陷严重程度权重的缺陷基数(Defect Base Numbers,缩写DBN),定义如下:

  其中wi为上述的各个严重程度的权重, 代表对应缺陷严重程度的缺陷数。

  因此可以定义PLDP如下:

  其中,DBNInTCcostomer是客户方发现并反馈给技术支持人员的错误并且该已被设计的测试用例覆盖的错误数计算出来的缺陷基数。DBNInTCcostomer是软件测试过程中发现的缺陷数计算出来的缺陷基数。测试执行过程缺陷遗漏率是用来软件测试过程中测试执行及其之后阶段的评价方法,测试用例覆盖到的缺陷,在测试执行过程中并未发现,是测试工程师执行测试用例时出现的问题。PLDP越小,测试过程中的测试执行过程有效性越高。

  2.2 测试用例丢失率

  测试用例的设计处于测试过程中的上游阶段,是测试执行的基础。测试用例的设计过程覆盖了测试计划、测试规格说明书等测试过程阶段。但是如何评价测试用例设计的优劣目前还无很好的办法。因此针对上述问题,本文提出测试用例丢失率(Test-Case LosePercentage,缩写TCLP)来评价测试用例的优劣程度。定义如下:

  其中,TestCasedesign是有客户方发现并反馈给技术支持人员的错误并且被测试用例覆盖的测试用例数。是软件测试过程中设计的测试用例数。测试用例丢失率是用来评价测试过程中,测试用例设计及其之前阶段的评价方法。客户发现的问题测试用例并未覆盖到,是测试计划、测试规格说明书和测试用例设计阶段问题。TCLP越小,测试过程中的测试用例设计及其之前的阶段的有效性越高。

  2.3 测试过程有效性评价方法

  测试过程失效率是由测试执行过程缺陷遗漏率和测试用例丢失率二者进行综合考量的。测试过程失效率(Ineffectivityof Testing Process Percentage,缩写ITPP)定义如下:

  ITPP =(PLDP+TCLP)/2

  测试过程有效性(Effective of Testing Process,缩写ETP)评价方法是通过测试过程失效率进行评价,测试过程失效率越小,测试过程的有效性越高。

  ETP = 1-ITPP

  对于一个测试项目的测试过程中,测试过程的有效性主要是通过系统上线运行后一定周期内客户发现缺陷数量为统计基础的。由于测试过程也是受各种因素影响,测试有效性达到100%是一个理想值,显示测试过程无法满足。因此本文引入六四格玛理论,当测试有效性达到99.997%时,就认定为测试过程是一个高质量的检测、检验过程;达到四西格玛93%以上99.997%以下,说明测试过程有待改进,但整体测试过程能够基本保证被测软件质量;达到二西格玛68%以上93%以下,说明测试过程不可信,测试结果无参考价值,测试过程必须改进。具体评价结果如下表所示:

▲表2 测试过程有效性评价结论对比表

  3、结论

  软件测试过程的有效性决定了测试结果的可信度,保证了软件产品的质量。本文通过分析软件测试过程,将其分成测试用例及其前期阶段和测试执行及其后期阶段,以被测产品上线运行一定时间内客户发现的缺陷和测试过程中发现缺陷为基本出发点,应用测试执行过程缺陷遗漏率和测试用例丢失率对软件过程有效性进行了评价,通过通过引入六西格玛质量评价方法对软件测试过程有效性进行了初步的划分。但是目前该方法仅仅只在部分软件系统中进行了初步的时间,例如对系统上线运行多长时间统计缺陷数等关键参数还需进一步分析研究。








====================================分割线================================



最新内容请见作者的GitHub页:http://qaseven.github.io/

目录
相关文章
|
25天前
|
测试技术 API 项目管理
API测试方法
【10月更文挑战第18天】API测试方法
41 1
|
23天前
|
测试技术 UED
软件测试中的“灰盒”方法:一种平衡透明度与效率的策略
在软件开发的复杂世界中,确保产品质量和用户体验至关重要。本文将探讨一种被称为“灰盒测试”的方法,它结合了白盒和黑盒测试的优点,旨在提高测试效率同时保持一定程度的透明度。我们将通过具体案例分析,展示灰盒测试如何在实际工作中发挥作用,并讨论其对现代软件开发流程的影响。
|
15天前
|
Java 测试技术 Maven
Java一分钟之-PowerMock:静态方法与私有方法测试
通过本文的详细介绍,您可以使用PowerMock轻松地测试Java代码中的静态方法和私有方法。PowerMock通过扩展Mockito,提供了强大的功能,帮助开发者在复杂的测试场景中保持高效和准确的单元测试。希望本文对您的Java单元测试有所帮助。
29 2
|
1月前
|
机器学习/深度学习 测试技术
ACL杰出论文奖:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力
【10月更文挑战第6天】约翰斯·霍普金斯大学等机构提出了一项荣获ACL杰出论文奖的研究,旨在解决大模型在心智理论(ToM)上的不足。他们发布了首个MMToM-QA多模态ToM测试集,并提出BIP-ALM方法,从多模态数据中提取统一表示,结合语言模型进行贝叶斯逆规划,显著提升了模型的ToM能力。这一成果为机器与人类自然交互提供了新思路,尽管仍面临一些局限性和技术挑战。论文详情见:https://arxiv.org/abs/2401.08743。
47 6
|
1月前
|
测试技术 Python
自动化测试项目学习笔记(三):Unittest加载测试用例的四种方法
本文介绍了使用Python的unittest框架来加载测试用例的四种方法,包括通过测试用例类、模块、路径和逐条加载测试用例。
60 0
自动化测试项目学习笔记(三):Unittest加载测试用例的四种方法
|
1月前
|
测试技术 Python
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
本文主要介绍了自动化测试中setup、teardown、断言方法的使用,以及unittest框架中setUp、tearDown、setUpClass和tearDownClass的区别和应用。
61 0
自动化测试项目学习笔记(二):学习各种setup、tearDown、断言方法
|
1月前
|
安全 测试技术 API
一图看懂API测试9种方法
一图看懂API测试九种方法:冒烟测试验证基本功能,功能测试确保符合规格,集成测试检查组件协同工作,回归测试防止新变更引入问题,负载测试评估性能稳定性,压力测试挑战极限负载,安全测试发现并修复漏洞,用户界面测试确保UI与API协调,模糊测试提升异常数据处理鲁棒性。
|
1月前
|
测试技术 UED
软件测试中的探索性测试:一种创新的质量保证方法
在软件开发的生命周期中,测试阶段扮演着至关重要的角色。传统的软件测试方法,如自动化测试和回归测试,虽然在一定程度上保证了软件质量,但它们往往依赖于预定义的测试用例和脚本,可能无法覆盖所有用户场景和边缘情况。为了克服这些限制,探索性测试作为一种创新的质量保证方法应运而生。本文将深入探讨探索性测试的概念、优势以及如何有效地实施它,以帮助读者更好地理解和应用这种测试技术。
|
7天前
|
JSON Java 测试技术
SpringCloud2023实战之接口服务测试工具SpringBootTest
SpringBootTest同时集成了JUnit Jupiter、AssertJ、Hamcrest测试辅助库,使得更容易编写但愿测试代码。
35 3
|
1月前
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
57 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)

热门文章

最新文章