在这样的一个图表中展示的数据就是带有内标签的,用于分类的数据,前面的三列分别指的是顾客的一些属性,比如说他有没有还款,他的婚姻状态以及收入状况。最后的一个类别,可以看到是用来判断这个用户是不是属于欺诈行为,对于这样的标签,它有两种取值,一种是yes,一种是no。这样的一个列,把它叫做class label,通常而言给定带有标签的这些数据,会把它分成两组,一组把它称之为training set,主要是用于去学习一些分类器,学习一些模型。另一部分把它称之为test set,也就是测试。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。