K-Means工作原理是什么呢?它的聚类步骤又是怎么样的?
K-Means工作原理就是根据我们初始化的聚类中心信息,算一下每以个样本到这些中心的距离,从而判断每个样本均归属于某个类簇,更新一下聚簇中心信息,然后重新计算每个样本到新的聚类中心的距离,再重新划分样本到新的聚类中心对应的类中,重复进行,直到满足终止条件。
假设咱们有N个样本点,那么用K-Means将其聚类的步骤如下:
一:先确定聚类的个数k,然后指定k个聚类的中心 ,可以是C1,C2..Ck
二:我们计算每个样本S点到k个中心的距离,然后将该点归入最近的C类中,然后把ie(1,N),j∈(1,k)
三:重新计算k个类簇的中心点,更新一下原有中心点的位置 C1,C2..Ck
四:重复步骤二、三,一直到中心点位置不再变化或者变化幅度小于
约定阈值,或者是达到预定义的最大循环次数,就可以结束,然后得到最终聚类结果。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。