一.作弊形态
1. 作弊动机
买家恶意竞争
BD流量恶意作弊
B2B对手的恶意竞争
2. 作弊方法
a) 简单作弊(重复点击)
b) 中级作弊(换IP、换COOKIE等,短频点击)
c) 大规模分布式攻击
二.反作弊
1. 规则模型
a) robot
b) pv时间与点击时间过长
c)pv时间与点击时间过短
d) cookie生成时间与点击时间过短
e) 代理
f) 黑名单
g) cookie max最大尝试次数
业务规则
a) 内部IP点击
b) 广告厂家自主点击
c) 点击时间差策略
d) cookie换了之后重复点击
2. 概率模型
a) 和谁比较(广告位置、来源(站内、搜索引擎、联盟站点、tanx流量广告系统)、投放方式(直接投放、弹窗、客户端))
b)如何抽样 广告主ID、搜索词、竞价词、来源站点、IPB(IP的C段和B段)
c)比较什么 cookieclick点击广告次数、用户step长度、useragent
d)如何检验(衡量差异) 聚合、离散化、相对熵比较法
相对熵比较算法:
差异衡量:
检验差异是否可以接受
过滤:
1. 异常分
2. 作弊程序
3. 过滤比
4. 训练指数->