使用基于聚类的异常检测方法进行异常检测有什么方法吗?
在基于DBSCAN的聚类算法中,将数据对象划分为三类,一类是核心点,指的是簇的中心点;一类是边界点,指的是位于簇边缘的点;还有一类点叫做异常点,也就是不属于任何一个簇的点,DBSCAN算法是直接可以识别异常数据的。
使用。
K-means算法进行聚类的时候,会将所有的数据对象都会划分到特定的簇中。针对K-means算法,可以设计每一个数据对象的异常评分。对象的异常评分可以用这个公式去计算:
其中dist(o,co)指的是计算数据对象o到它所在簇中心的距离,avg_dist(co)指的是数据集中各个簇的中心距离的平均值。如果这个值比较大,就意味着这个数据对象可能离它所在的中心的距离是非常大的,就把这样的数据点认为是异常点。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。