ICLR Spotlight! 清华提出时序异常检测算法,连刷5个SOTA

简介: ICLR Spotlight! 清华提出时序异常检测算法,连刷5个SOTA



 新智元报道  

作者:吴海旭

编辑:好困

【新智元导读】时序数据的异常检测是高端装备行业的关键问题,清华大学软件学院机器学习实验室从全新的关联差异视角分析此问题,从模型、训练策略、异常判据全链路提供了完整的解决方法,被ICLR接收为Spotlight(亮点)文章。


现实世界的系统在运行过程中会产生大量的时序数据。

通过这些时序数据发现系统中可能存在的异常现象对于保障系统安全、设备平稳运行以及避免经济损失都有着非常重大的意义,例如大规模服务器、地空、水电设备的监测等。

因此,来自清华大学软件学院的团队重点研究了无监督时序异常检测问题,并被ICLR 2022接收为Spotlight。作者:徐介晖*、吴海旭*、王建民、龙明盛论文链接:https://openreview.net/forum?id=LzQQ89U1qm_

在实际应用中,时序数据的异常检测极其困难,它需要从占主导地位的正常数据中发掘出异常点或者异常时间模式,其中涉及两个核心问题:

(1) 如何通过网络获取更具信息含量的表征,从而使得异常的表征不会被「淹没」于正常数据中;

(2) 如何基于学习的表征定义更加具有区分性的判据,用于筛选异常。

1. 动机


从时间序列的本质属性出发,我们发现每一个时间点都可以由其与整个序列的关联关系来表示,即表示为其在时间维度上的关联权重分布。相比于点级别的特征,这种关联关系暗含了序列的模式信息,比如周期、趋势等,因此更具信息含量。同时,与正常点相比较,异常点很难与正常模式主导的整个序列都建立强关联关系,它们往往更加关注邻近区域(由于连续性)。因此,这种与整体序列、邻近先验之间的关联差异,为异常检测提供了一个天然的、强区分度的判据。基于以上观察,我们提出了Anomaly Transformer模型,实现了基于关联差异(Association Discrepancy)的时序异常检测。其包含Anomaly-Attention机制用于分别建模两种形式的关联,同时以极小极大(Minimax)关联学习策略进一步增大正常点与异常点之间差别。值得一提的是,在不同领域的5个数据集上,Anomaly Transformer都取得了SOTA的效果。


2. 方法

2.1 Anomaly Transformer

2.1.1 整体架构

相比于标准的Transformer模型,Anomaly Transformer中在每层中都新设计了一个Anomaly-Attention单元,用于从多层次的深度特征中学习潜在的时序关联。

整体架构如上图所示,Anomaly-Attention(左)同时建模了数据的先验关联(Prior-Association,即更关注邻近区域的先验)和序列关联(Series-Association,即从数据中挖掘的依赖)。

除了序列重建任务之外,我们的模型还采用了极小极大策略(Minimax)用于进一步增大异常点和正常点所具有的关联差异的差距,从而使得异常点能够被更加容易的检测出来。

2.1.2 Anomaly-Attention

为了计算关联差异,我们提出的一种全新的注意力机制Anomaly-Attention,用于统一建模先验关联和序列关联。(1)先验关联用于表示由于时间序列连续性带来的,每个时刻更多地关注其邻近区域的先验。我们采用了一个具有可学习尺度参数的高斯核函数来表示。高斯核函数的中心位于对应时间点的索引上,由于高斯分布本身所具有的单峰分布的特性,这样的设计能够帮助学习到的权重天然的集中于对应时间点的邻域内。同时,自适应的尺度参数可以帮助先验关联动态适应不同的时序模式。(2)序列关联用于表示直接从序列数据中挖掘出的依赖。其计算方式与标准Transformer的注意力矩阵计算方式类似,注意力矩阵中每一行的权重分布都对应了一个时间点的序列关联。同时,为了更好的完成序列重建任务,模型会自动挖掘到合理的时序依赖。通过上述设计,模型可以分别捕捉到先验关联和序列关联,相较于过往的模型这种基于关联的表征蕴含着更加丰富的信息。

2.1.3 关联差异(Association Discrepancy)

我们将关联差异定义为这两者之间的差异,作为后续异常检测的判据,它由各个层次的先验关联、序列关联之间的对称KL距离计算得到:

2.2 极小极大关联学习

除了无监督任务广泛使用的重建误差外,我们还引入了一个额外的关联差异损失用于增大正常点和异常点之间的差距(如下所示)。

得益于先验关联的单峰特性,新增的关联差异损失会驱使序列关联更加关注非邻近的区域,这会使得异常点的重建更加的艰难,进而正常点和异常点之间的辨别更加容易。然而,在实验中发现,若直接最小化关联差异将使得先验分布中可学习的尺度参数急剧变小,造成模型退化。因此,我们使用了极小极大(Minimax)策略用于更好的控制关联学习的过程。(1) 在最小化阶段,固定序列关联,让先验关联近似,这样可以使先验关联适应不同的时序模式。(2) 在最大化阶段,固定先验关联,优化序列关联以最大化关联之间的差异,该过程可以让序列关联更加关注于非临接、全局的点,从而使得异常点的重建更加困难。最终,我们将标准化后的关联差异与重建误差结合起来,定义了新的异常检测判据


3. 实验


我们在5个标准数据集上进行了模型验证,涵盖服务检测、地空探索等多个应用。Anomaly Transformer在5个基准中均实现了SOTA的效果。更多基准模型及数据说明请见论文。

3.1 消融实验

我们设计消融实验验证了提出的先验关联、训练策略、新的异常判据的有效性。

3.2 判据分析

针对时序异常的5种类型,我们可视化了其在不同异常判据下的区分性。可以发现基于关联差异的异常评判曲线有着更加准确的可区分性。

3.3 先验关联分析

针对上述不同的异常类别,我们也提供了先验关联中学到参数的可视化。如图所示,异常点处的相较于序列中别的点往往会比较小,这代表了它与非临接部分的关联较弱,这也印证了异常点很难与整个序列构建强关联的先验。

4. 总结


本文关注无监督时序异常检测问题,提出了基于关联差异的异常检测模型Anomaly transformer,并通过一个极小极大(Minimax)关联学习策略大幅提高了模型的异常检测能力。

Anomaly transformer在服务器监测、地空探索、水流观测等应用中均展现出了优秀的异常检测结果,具有很强的应用落地价值。


参考资料:

https://openreview.net/pdf?id=LzQQ89U1qm_

相关文章
|
2月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于MSER和HOG特征提取的SVM交通标志检测和识别算法matlab仿真
### 算法简介 1. **算法运行效果图预览**:展示算法效果,完整程序运行后无水印。 2. **算法运行软件版本**:Matlab 2017b。 3. **部分核心程序**:完整版代码包含中文注释及操作步骤视频。 4. **算法理论概述**: - **MSER**:用于检测显著区域,提取图像中稳定区域,适用于光照变化下的交通标志检测。 - **HOG特征提取**:通过计算图像小区域的梯度直方图捕捉局部纹理信息,用于物体检测。 - **SVM**:寻找最大化间隔的超平面以分类样本。 整个算法流程图见下图。
|
21天前
|
存储 人工智能 自然语言处理
Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
Delta-CoMe是由清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法。该算法通过结合低秩分解和低比特量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。Delta-CoMe特别适用于处理数学、代码和多模态等复杂任务,并在推理速度上有所提升。
55 6
Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
|
1月前
|
机器学习/深度学习 监控 算法
基于反光衣和检测算法的应用探索
本文探讨了利用机器学习和计算机视觉技术进行反光衣检测的方法,涵盖图像预处理、目标检测与分类、特征提取等关键技术。通过YOLOv5等模型的训练与优化,展示了实现高效反光衣识别的完整流程,旨在提升智能检测系统的性能,应用于交通安全、工地监控等领域。
|
1月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA-PSO-SVM算法的混沌背景下微弱信号检测matlab仿真
本项目基于MATLAB 2022a,展示了SVM、PSO、GA-PSO-SVM在混沌背景下微弱信号检测中的性能对比。核心程序包含详细中文注释和操作步骤视频。GA-PSO-SVM算法通过遗传算法和粒子群优化算法优化SVM参数,提高信号检测的准确性和鲁棒性,尤其适用于低信噪比环境。
|
2月前
|
算法 安全
分别使用OVP-UVP和OFP-UFP算法以及AFD检测算法实现反孤岛检测simulink建模与仿真
本课题通过Simulink建模与仿真,实现OVP-UVP、OFP-UFP算法及AFD检测算法的反孤岛检测。OVP-UVP基于电压幅值变化,OFP-UFP基于频率变化,而AFD则通过注入频率偏移信号来检测孤岛效应,确保电力系统安全稳定运行。系统使用MATLAB 2013b进行建模与仿真验证。
|
1月前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
55 0
|
2月前
|
算法 计算机视觉 Python
圆形检测算法-基于颜色和形状(opencv)
该代码实现了一个圆检测算法,用于识别视频中的红色、白色和蓝色圆形。通过将图像从RGB转换为HSV颜色空间,并设置对应颜色的阈值范围,提取出目标颜色的区域。接着对这些区域进行轮廓提取和面积筛选,使用霍夫圆变换检测圆形,并在原图上绘制检测结果。
95 0
|
4月前
|
机器学习/深度学习 监控 算法
目标检测算法技术
8月更文挑战第11天
|
4月前
|
机器学习/深度学习 监控 算法
目标检测算法
8月更文挑战第5天
|
4月前
|
机器学习/深度学习 监控 算法
目标检测算法
8月更文挑战第8天