主动发现作弊的核心算法是什么?
收起
1
条回答
写回答
取消
提交回答
-
- 识别机器作弊(点):早期的作弊是机器点击、业务上的无效点击上线规则,规则只关注较少维度的信息。比如识别爬虫、内网点击。我们称之为单点反作弊。 2.识别个人简单作弊(线):在作弊者升级到人工作弊后,我们会升级到计数、比例、分布等统计策略和行为序列模型。我们称之为线上反作弊。 下图是我们发现的网站某行业出现的一类攻击,作弊者只访问A、B、C、G共4类页面,因为他的目的就是点广告。正常用户访问页面很丰富。还会访问D、E、F、H等页面,想咨询买东西。我们将用户近7天在网站的访问页面序列作为特征,识别本次点击是否是作弊点击。先通过Word2Vec对每个页面进行文本向量化编码。然后模型预测向量序列是否是作弊点击。 3.识别个人高级作弊(面):在我们识别上述作弊后,接着作弊者又升级高级的人工作弊,模拟人的点击,尽可能的各种特征上不集中,但是毕竟作弊者要达到收益的话,需要有一定的作弊量,而他们不知道正常点击的真实分布,自然的会在一些维度上出现异常,故我们反作弊算法升级到无监督相对熵模型,再后面有样本了升级到有监督的GBDT和Wide&Deep,均是从多个维度和特征上识别作弊。我们称之为面上反作弊。
2022-05-12 17:22:09