【数据挖掘算法】(二)MSET 算法参差分析

简介: 【数据挖掘算法】(二)MSET 算法参差分析

文章目录


一、滑动窗口残差统计法

二、序贯概率比检验


一、滑动窗口残差统计法


记某段时间内,MSET模型的预测残差序列为:


image.png


采用滑动窗口残差统计方法的原因:


该方法能够连续实时地检测残差统计特性的变化,算法简单,适合在线实时分析。


MSET模型采用过程记忆矩阵D中合理选择的有限个历史观测向量代表整个齿轮箱温度特性的正常工作空间。其对整个正常工作空间总体上覆盖能力较好,但对正常工作空间的不同区域,其覆盖能力是有差异的。当MSET模型的输入观测向量位于这些区域时,其预测精度会有所下降,即在残差序列中会出现一些孤立的残差相对较大的点。这些孤立的残差相对较大的点并不是设备故障的征兆。滑动窗口残差统计方法计算滑动窗口内多个残差的统计特性,对上述情况下的孤立较大残差的不利影响具有很好的抑制作用。


通过合理选择滑动窗口的宽度n ,既能及时迅速地反映残差统计特性的连续变化,又能消除随机因素的影响,提高齿轮箱状态监测的可靠性,降低误报警的几率。


当设备工作正常时,MSET温度模型预测精度很高,预测残差的均值接近0,且标准差较小。


当设备出现故障隐患时,其工作特性会发生改变,使新的观测向量偏离正常工作状态空间。


MSET温度模型预测残差增大,统计特性改变主要表现为以下3种形式:


1) 残差的均值仍接近0,但残差的标准差明显增大,表现为残差的散布范围增大;


2) 残差的均值以较大幅度偏离0,但残差的标准差变化不大,表现为预测残差出现系统偏差,偏零值;


3)以上两种情况的组合。


确定残差均值和标准差的故障阈值,记其分别为EY 和SY。当模型预测的残差滑动窗口统计特性同时超过两个设定阈值时,发出故障隐患报警。残差均值和标准差阈值可以由运行人员根据经验确定。记验证序列的残差绝对值最大值(也就是所有)为EV,标准差的最大值为SV,则设备故障征兆诊断的阈值标准为:


image.png


由于非参数模型在对输入进行预测时,存在一定的不确定性。为简化起见,认为残差服从均值和方差均未知的正态分布,在计算滑动窗口中残差序列的均值和标准差时,需要给出置信度为1−α的均值和标准差的置信区间。对于总体均值和方差未知的正态分布残差序列,均值和标准差的置信度为1−α的置信区间分别为:


image.png


式中:n、Xε 和Sε 分别为滑动窗口的宽度、均值和标准差;t_(α/2)和χ_(α/2)2分别为t分布和χ2分布的α/2分位点。当均值或标准差置信区间超过阈值时,发出设备故障征兆报警信息。


二、序贯概率比检验


序贯概率比检验(SPRT)是一种统计决策方法,它能在保证2种检验错误足够小的前提下,仍然可以作出判断,克服了似然比检验只能保证1种检验错误足够小的缺陷。序贯概率比定义如下:


λ=(L(S_n |H_1))/(L(S_n |H_0)) (22)


式中,下标n为样本量;L(S_n |H_i)是当Hi(i=0或1)为真时观测样本序列Sn的似然函数,其中


H0为原假设,设备正常;H1为备择假设,设备故障.若α为给定误报警率,β为给定漏报警率,则以下规则决定接受哪个假设:① λ≥(1-β)/α,接受H1;②λ≤β/(1-α),接受H0;③B<λ< A,不能决定,增加样本数量到n+1,再用规则①、②进行判断。上述规则可以保证SPRT实际的误报警和漏报警(分别用α^ ’和β^ ’表示)被限制在一定范围内:


α^ ’+β^’≤α+β (23)


也就是说,实际的误报警率和漏报警率的和不会超过其规定值。


假定残差遵从高斯分布。在这个假定下,L(S_n |H_i)可以计算出来,序贯概率比被简化为:


image.png

目录
相关文章
|
4月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
149 3
|
1月前
|
存储 算法 安全
基于哈希表的文件共享平台 C++ 算法实现与分析
在数字化时代,文件共享平台不可或缺。本文探讨哈希表在文件共享中的应用,包括原理、优势及C++实现。哈希表通过键值对快速访问文件元数据(如文件名、大小、位置等),查找时间复杂度为O(1),显著提升查找速度和用户体验。代码示例展示了文件上传和搜索功能,实际应用中需解决哈希冲突、动态扩容和线程安全等问题,以优化性能。
|
2月前
|
缓存 算法 搜索推荐
Java中的算法优化与复杂度分析
在Java开发中,理解和优化算法的时间复杂度和空间复杂度是提升程序性能的关键。通过合理选择数据结构、避免重复计算、应用分治法等策略,可以显著提高算法效率。在实际开发中,应该根据具体需求和场景,选择合适的优化方法,从而编写出高效、可靠的代码。
60 6
|
3月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
101 1
|
4月前
|
并行计算 算法 IDE
【灵码助力Cuda算法分析】分析共享内存的矩阵乘法优化
本文介绍了如何利用通义灵码在Visual Studio 2022中对基于CUDA的共享内存矩阵乘法优化代码进行深入分析。文章从整体程序结构入手,逐步深入到线程调度、矩阵分块、循环展开等关键细节,最后通过带入具体值的方式进一步解析复杂循环逻辑,展示了通义灵码在辅助理解和优化CUDA编程中的强大功能。
|
4月前
|
算法
PID算法原理分析
【10月更文挑战第12天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
|
5月前
|
算法 搜索推荐 开发者
别再让复杂度拖你后腿!Python 算法设计与分析实战,教你如何精准评估与优化!
在 Python 编程中,算法的性能至关重要。本文将带您深入了解算法复杂度的概念,包括时间复杂度和空间复杂度。通过具体的例子,如冒泡排序算法 (`O(n^2)` 时间复杂度,`O(1)` 空间复杂度),我们将展示如何评估算法的性能。同时,我们还会介绍如何优化算法,例如使用 Python 的内置函数 `max` 来提高查找最大值的效率,或利用哈希表将查找时间从 `O(n)` 降至 `O(1)`。此外,还将介绍使用 `timeit` 模块等工具来评估算法性能的方法。通过不断实践,您将能更高效地优化 Python 程序。
97 4
|
5月前
|
算法 程序员 Python
程序员必看!Python复杂度分析全攻略,让你的算法设计既快又省内存!
在编程领域,Python以简洁的语法和强大的库支持成为众多程序员的首选语言。然而,性能优化仍是挑战。本文将带你深入了解Python算法的复杂度分析,从时间与空间复杂度入手,分享四大最佳实践:选择合适算法、优化实现、利用Python特性减少空间消耗及定期评估调整,助你写出高效且节省内存的代码,轻松应对各种编程挑战。
123 1
|
4月前
|
算法
PID算法原理分析及优化
【10月更文挑战第6天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
121 0
|
4月前
|
算法 安全 Go
Python与Go语言中的哈希算法实现及对比分析
Python与Go语言中的哈希算法实现及对比分析
77 0