训练数据:每条数据都有标签(知道所属的类),一个标签代表一类。
测试数据:把新数据(无标签)的每一个特征与样本集中数据对应的特征进行比较,然后提取
与训练数据集最相似的(最邻近)的分类标签。
最后提取样本数据集中前K个最相似的数据(kNN的出处)和K 一般小于20的整数。在K个数
据中,出现最多的标签作为该数据的标签。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。