批量挖掘到有价值样本放进训练集训练模型,就能提高性能?
too young, too simple ! (= =)|||
训练样本的各个类别间数据比例均衡,对模型性能影响很大。很多主动学习方法,如QBC方法、entropy方法等,都没有考虑数据均衡问题,仅挑选其考量方式下最有价值的样本。我们的经验是,在控制类别均衡的前提下,再通过主动学习方法考量样本的价值,按照合理的比例从各类别中挖掘会有价值的训练样本。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。