没有使用主动学习(Active Learning,AL)前,我们面对的业务问题是什么?
面临的业务问题有以下3点: 1. 提升模型性能:CRO内容安全团队的风控模型每个月都有性能提升。 2. 利用回流数据:各个业务场景不断产生新的违规方式,我们需要对新违规样本进行防控,而线上回流数据量巨大,对回流数据直接标注并训练,非常低效,而且标注成本、训练机器成本、训练时间成本巨大。 3. 处理脏数据:尽管图片标注标准唯一确定,但是每位标注员对标准的定义理解有分歧,容易出现错打标,数据集中存在一定比例的脏数据。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。