5 分钟内开始使用异常检测算法

简介: 5 分钟内开始使用异常检测算法

异常检测已迅速从计算机科学理论转移到数据科学家的日常实际应用中。现在,它已成为全球许多企业数据清理和 KPI 审查的重要组成部分。总体而言,它大大提高了预测模型的准确性,可以帮助企业快速识别和响应异常。

今天,为了帮助您开始学习这个密集的主题,我们将探索一个 5 分钟的速成课程,了解什么是异常检测、为什么使用它以及一些基本算法。 异常检测是每一种现代机器学习技术的重要组成部分 它可以帮助您构建更具适应性的回归系统,清除分类器系统训练数据中的缺陷,并从监督学习程序中移除异常数据。这种数学方法对于大数据和数据挖掘应用特别有用,因为人眼几乎不可能注意到具有数千个数据点的数据可视化中的异常值。

由于其用例数量众多,来自不同行业的企业都在其数据策略中实施异常检测。例如,许多公司选择使用异常检测方法来跟踪其关键绩效指标 (KPI)。这使他们能够更快地注意到纸上的异常趋势,并在不断变化的现实市场中更加敏捷。

异常检测也被网络安全专家用于先进的人工智能驱动的欺诈检测和入侵检测系统。这些系统使用先进的数据分析技术来实时跟踪和标记可疑的用户行为。

基本异常检测算法

网络异常,图片无法展示
|

基于密度的技术

基于密度的技术包括常用技术,例如 K 最近邻 (KNN)、局部异常值因子 (LOF)、隔离森林(类似于决策树)等。这些技术可用于回归或分类系统。

这些算法中的每一个都通过遵循最高数据点密度的线来生成预期的行为。落在这些密集区域之外具有统计意义的任何点都被标记为异常。这些技术中的大多数都依赖于点之间的距离,这意味着必须标准化单位并在数据集中缩放以确保准确的结果。

例如,在 KNN 系统中,数据点由 的值加权1/k,其中k是到数据点最近邻居的距离。这意味着距离较近的数据点的权重很大,因此比距离较远的数据点对标准的影响更大。然后系统通过查看具有低值的点来标记异常值1/k

用例

您有规范化的、未标记的数据,您想要扫描这些数据以查找异常,但您对具有复杂计算的算法不感兴趣。

网络异常,图片无法展示
|

一类支持向量机

一类支持向量机(one-class SVM)算法是一种监督学习模型,可产生鲁棒的预测模型。它主要用于分类。该系统使用一组训练示例,每个示例都标记为两个类别之一的一部分。然后,系统会创建标准,用于将新示例分类到每个类别中。该算法将示例映射到空间中的点,以最大限度地区分两个类别。

如果异常值超出任一类别的空间太远,系统会标记异常值。如果您没有标记数据,则可以使用一种无监督学习方法,该方法在示例之间寻找聚类来定义类别。

用例

您的数据应该主要属于两个预期类别,并且想要查找哪些数据点位于任一类别之外。

网络异常,图片无法展示
|

K均值聚类异常检测算法

K 均值聚类算法是一种类似于 KNN 方法的分类算法,因为它依赖于每个数据点与其他附近点的接近程度,并且类似于 SVM,因为它主要侧重于分类到不同的类别中。

每个数据点根据其特征分为几类。每个类别都有一个中心点或质心,用作集群内所有其他数据点的原型。然后将其他点与这些原型进行比较以确定它们的 k 均值,该值本质上充当原型和当前数据点之间差异的度量。较高的 k 均值数据点映射到更靠近原型的位置,从而创建一个集群。

K 均值聚类可以通过标记与任何已建立类别不紧密对齐的点来检测异常。

用例

您拥有由许多不同类型的数据组成的未标记数据,您希望通过与学习原型的相似性来组织这些数据。


相关文章
|
3月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于MSER和HOG特征提取的SVM交通标志检测和识别算法matlab仿真
### 算法简介 1. **算法运行效果图预览**:展示算法效果,完整程序运行后无水印。 2. **算法运行软件版本**:Matlab 2017b。 3. **部分核心程序**:完整版代码包含中文注释及操作步骤视频。 4. **算法理论概述**: - **MSER**:用于检测显著区域,提取图像中稳定区域,适用于光照变化下的交通标志检测。 - **HOG特征提取**:通过计算图像小区域的梯度直方图捕捉局部纹理信息,用于物体检测。 - **SVM**:寻找最大化间隔的超平面以分类样本。 整个算法流程图见下图。
|
2月前
|
机器学习/深度学习 监控 算法
基于反光衣和检测算法的应用探索
本文探讨了利用机器学习和计算机视觉技术进行反光衣检测的方法,涵盖图像预处理、目标检测与分类、特征提取等关键技术。通过YOLOv5等模型的训练与优化,展示了实现高效反光衣识别的完整流程,旨在提升智能检测系统的性能,应用于交通安全、工地监控等领域。
|
3月前
|
算法 安全
分别使用OVP-UVP和OFP-UFP算法以及AFD检测算法实现反孤岛检测simulink建模与仿真
本课题通过Simulink建模与仿真,实现OVP-UVP、OFP-UFP算法及AFD检测算法的反孤岛检测。OVP-UVP基于电压幅值变化,OFP-UFP基于频率变化,而AFD则通过注入频率偏移信号来检测孤岛效应,确保电力系统安全稳定运行。系统使用MATLAB 2013b进行建模与仿真验证。
|
2月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA-PSO-SVM算法的混沌背景下微弱信号检测matlab仿真
本项目基于MATLAB 2022a,展示了SVM、PSO、GA-PSO-SVM在混沌背景下微弱信号检测中的性能对比。核心程序包含详细中文注释和操作步骤视频。GA-PSO-SVM算法通过遗传算法和粒子群优化算法优化SVM参数,提高信号检测的准确性和鲁棒性,尤其适用于低信噪比环境。
|
2月前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
63 0
|
3月前
|
算法 计算机视觉 Python
圆形检测算法-基于颜色和形状(opencv)
该代码实现了一个圆检测算法,用于识别视频中的红色、白色和蓝色圆形。通过将图像从RGB转换为HSV颜色空间,并设置对应颜色的阈值范围,提取出目标颜色的区域。接着对这些区域进行轮廓提取和面积筛选,使用霍夫圆变换检测圆形,并在原图上绘制检测结果。
102 0
|
5月前
|
机器学习/深度学习 监控 算法
目标检测算法技术
8月更文挑战第11天
|
5月前
|
机器学习/深度学习 监控 算法
目标检测算法
8月更文挑战第5天
|
5月前
|
机器学习/深度学习 监控 算法
目标检测算法
8月更文挑战第8天
|
6月前
|
监控 算法 自动驾驶
目标检测算法:从理论到实践的深度探索
【7月更文第18天】目标检测,作为计算机视觉领域的核心任务之一,旨在识别图像或视频中特定对象的位置及其类别。这一技术在自动驾驶、视频监控、医疗影像分析等多个领域发挥着至关重要的作用。本文将深入浅出地介绍目标检测的基本概念、主流算法,并通过一个实际的代码示例,带您领略YOLOv5这一高效目标检测模型的魅力。
871 11

热门文章

最新文章