【数据挖掘算法】(二)MSET 算法参差分析

简介: 【数据挖掘算法】(二)MSET 算法参差分析

文章目录


一、滑动窗口残差统计法

二、序贯概率比检验


一、滑动窗口残差统计法


记某段时间内,MSET模型的预测残差序列为:


image.png


采用滑动窗口残差统计方法的原因:


该方法能够连续实时地检测残差统计特性的变化,算法简单,适合在线实时分析。


MSET模型采用过程记忆矩阵D中合理选择的有限个历史观测向量代表整个齿轮箱温度特性的正常工作空间。其对整个正常工作空间总体上覆盖能力较好,但对正常工作空间的不同区域,其覆盖能力是有差异的。当MSET模型的输入观测向量位于这些区域时,其预测精度会有所下降,即在残差序列中会出现一些孤立的残差相对较大的点。这些孤立的残差相对较大的点并不是设备故障的征兆。滑动窗口残差统计方法计算滑动窗口内多个残差的统计特性,对上述情况下的孤立较大残差的不利影响具有很好的抑制作用。


通过合理选择滑动窗口的宽度n ,既能及时迅速地反映残差统计特性的连续变化,又能消除随机因素的影响,提高齿轮箱状态监测的可靠性,降低误报警的几率。


当设备工作正常时,MSET温度模型预测精度很高,预测残差的均值接近0,且标准差较小。


当设备出现故障隐患时,其工作特性会发生改变,使新的观测向量偏离正常工作状态空间。


MSET温度模型预测残差增大,统计特性改变主要表现为以下3种形式:


1) 残差的均值仍接近0,但残差的标准差明显增大,表现为残差的散布范围增大;


2) 残差的均值以较大幅度偏离0,但残差的标准差变化不大,表现为预测残差出现系统偏差,偏零值;


3)以上两种情况的组合。


确定残差均值和标准差的故障阈值,记其分别为EY 和SY。当模型预测的残差滑动窗口统计特性同时超过两个设定阈值时,发出故障隐患报警。残差均值和标准差阈值可以由运行人员根据经验确定。记验证序列的残差绝对值最大值(也就是所有)为EV,标准差的最大值为SV,则设备故障征兆诊断的阈值标准为:


image.png


由于非参数模型在对输入进行预测时,存在一定的不确定性。为简化起见,认为残差服从均值和方差均未知的正态分布,在计算滑动窗口中残差序列的均值和标准差时,需要给出置信度为1−α的均值和标准差的置信区间。对于总体均值和方差未知的正态分布残差序列,均值和标准差的置信度为1−α的置信区间分别为:


image.png


式中:n、Xε 和Sε 分别为滑动窗口的宽度、均值和标准差;t_(α/2)和χ_(α/2)2分别为t分布和χ2分布的α/2分位点。当均值或标准差置信区间超过阈值时,发出设备故障征兆报警信息。


二、序贯概率比检验


序贯概率比检验(SPRT)是一种统计决策方法,它能在保证2种检验错误足够小的前提下,仍然可以作出判断,克服了似然比检验只能保证1种检验错误足够小的缺陷。序贯概率比定义如下:


λ=(L(S_n |H_1))/(L(S_n |H_0)) (22)


式中,下标n为样本量;L(S_n |H_i)是当Hi(i=0或1)为真时观测样本序列Sn的似然函数,其中


H0为原假设,设备正常;H1为备择假设,设备故障.若α为给定误报警率,β为给定漏报警率,则以下规则决定接受哪个假设:① λ≥(1-β)/α,接受H1;②λ≤β/(1-α),接受H0;③B<λ< A,不能决定,增加样本数量到n+1,再用规则①、②进行判断。上述规则可以保证SPRT实际的误报警和漏报警(分别用α^ ’和β^ ’表示)被限制在一定范围内:


α^ ’+β^’≤α+β (23)


也就是说,实际的误报警率和漏报警率的和不会超过其规定值。


假定残差遵从高斯分布。在这个假定下,L(S_n |H_i)可以计算出来,序贯概率比被简化为:


image.png

目录
相关文章
|
5天前
|
算法 Java 测试技术
算法分析(蛮力法与减治算法应用实验报告)
这篇文章是关于算法分析的实验报告,介绍了如何使用蛮力法解决背包问题,并通过伪代码和Java代码实现,同时分析了其时间效率;还介绍了基于减治法思想实现的二叉查找树的插入与查找,同样提供了伪代码、Java源代码实现和时间效率分析,最后展示了测试结果截图。
算法分析(蛮力法与减治算法应用实验报告)
|
12天前
|
机器学习/深度学习 数据采集 算法
【优秀python算法毕设】基于python时间序列模型分析气温变化趋势的设计与实现
本文介绍了一个基于Python的时间序列模型,用于分析和预测2021-2022年重庆地区的气温变化趋势,通过ARIMA和LSTM模型的应用,揭示了气温的季节性和趋势性变化,并提供了对未来气温变化的预测,有助于气象预报和相关决策制定。
【优秀python算法毕设】基于python时间序列模型分析气温变化趋势的设计与实现
|
2天前
|
机器学习/深度学习 人工智能 算法
【人工智能】传统语音识别算法概述,应用场景,项目实践及案例分析,附带代码示例
传统语音识别算法是将语音信号转化为文本形式的技术,它主要基于模式识别理论和数学统计学方法。以下是传统语音识别算法的基本概述
11 2
|
5天前
|
机器学习/深度学习 存储 算法
算法时间复杂度分析
这篇文章讲解了如何分析算法的时间复杂度,包括关注循环执行次数最多的代码段、总复杂度的确定、嵌套代码复杂度的计算方法,并提供了大O阶的推导步骤和常见时间复杂度的列表,同时还介绍了空间复杂度的概念及其重要性。
|
7天前
|
编解码 算法 Linux
Linux平台下RTSP|RTMP播放器如何跟python交互投递RGB数据供视觉算法分析
在对接Linux平台的RTSP播放模块时,需将播放数据同时提供给Python进行视觉算法分析。技术实现上,可在播放时通过回调函数获取视频帧数据,并以RGB32格式输出。利用`SetVideoFrameCallBackV2`接口设定缩放后的视频帧回调,以满足算法所需的分辨率。回调函数中,每收到一帧数据即保存为bitmap文件。Python端只需读取指定文件夹中的bitmap文件,即可进行视频数据的分析处理。此方案简单有效,但应注意控制输出的bitmap文件数量以避免内存占用过高。
|
10天前
|
算法
PID算法原理分析及优化
今天为大家介绍一下经典控制算法之一的PID控制方法。PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。 在大学期间,参加的智能汽车竞赛中就使用到了PID经典控制算法,对于智能小车的调试更加的方便。 一、PID原理 PID控制方法将偏差的比例(proportional)、积分(integral)、微分(derivative)通过线性组合构成控制量,对被控对象进行控制。 常规的PID控制系统如图所示: 系统的输入r(t)为控制量的目标输出值,输出y(t)为控制量的实际输出值,e(t)为输出量目标值与实际值
26 1
|
13天前
|
机器学习/深度学习 数据采集 算法
基于SVm和随机森林算法模型的中国黄金价格预测分析与研究
本文通过运用支持向量机(SVM)、决策树和随机森林算法,结合历史黄金价格数据和特征工程,建立了中国黄金价格的预测模型,并通过模型训练、评估及可视化分析,为黄金市场投资者和分析师提供了基于机器学习算法的预测方法和决策支持。
|
13天前
|
机器学习/深度学习 数据采集 存储
基于Python+flask+echarts的气象数据采集与分析系统,可实现lstm算法进行预测
本文介绍了一个基于Python、Flask和Echarts的气象数据采集与分析系统,该系统集成了LSTM算法进行数据预测,并提供了实时数据监测、历史数据查询、数据可视化以及用户权限管理等功能。
|
13天前
|
数据采集 自然语言处理 数据可视化
基于python数据挖掘在淘宝评价方面的应用与分析,技术包括kmeans聚类及情感分析、LDA主题分析
本文探讨了基于Python数据挖掘技术在淘宝评价分析中的应用,涵盖了数据采集、清洗、预处理、评论词频分析、情感分析、聚类分析以及LDA主题建模和可视化,旨在揭示淘宝客户评价中的潜在模式和情感倾向,为商家和消费者提供决策支持。
|
13天前
|
机器学习/深度学习 数据采集 数据可视化
基于机器学习的一线城市租房价格预测分析与实现,实现三种算法预测
本文通过数据采集、处理、特征选择和机器学习建模,对一线城市租房价格进行预测分析,比较了随机森林、一元线性回归和多元线性回归模型,并发现随机森林模型在预测租房价格方面表现最佳,为租房市场参与者提供决策支持。

热门文章

最新文章