交叉验证(k-折叠,其中k=10是最流行的),是指将数据进行又放回的采样,然后随机划分为k个互斥子集,每个子集大小大致相等。每次在k个部分中取一部分作为测试集,其余的作为训练集,之后得到一个分类器,以此计算它们的精度,把得到的精度加起来取平均值。
在第一次迭代时,使用D;作为测试集,其他作为训练集
余一法:每次取一个作为测试集,其余的作为训练集。对于小数据,k折叠,其中k=#的元组。
分层交叉验证:折叠被分层,以便在每个折叠中的类分布与初始数据中的分布大致相同。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。