营销(羊毛党)反欺诈建模全流程

简介: 欺诈是用户主观、以非法占有为目的,采用虚构事实或隐瞒事实真相的方法,骗取他人财物或金融机构信用,破坏金融管理秩序的行为。

1 欺诈定义


欺诈是用户主观、以非法占有为目的,采用虚构事实或隐瞒事实真相的方法,骗取他人财物或金融机构信用,破坏金融管理秩序的行为。


  • 按照欺诈的人数来分可分为:个体欺诈和团伙欺诈;


  • 按照欺诈的主体来可分为第一、第二、第三方欺诈;


  • 按照欺诈的行为可分为:金融信贷欺诈、互联网业务欺诈和信用卡欺诈三大类。按照欺诈的行为,大的方向上可分为:金融信贷欺诈、互联网业务欺诈和信用卡欺诈三大类,如果进一步 细分落到具体的场景上有:盗刷、薅羊毛、骗贷、套现、刷单、 刷好评等行为,根据不同的欺诈场景的应对方法是有所不同的。



2 营销业务欺诈背景


营销欺诈是互联网业务欺诈大类的一种,指的是羊毛党通过虚假身份参加营销活动大量获利的行为。据统计,存在1000万+被滥用身份信息、 200万+网络黑产从业者、超千亿黑产市场规模。“羊毛党”也逐渐从分散个体向组团集聚发展,形成了有组织、有规模、有分工的职业“羊毛党”。



在此背景下,为避免营销资源浪费,在加强活动规则设计的同时,亟需运用技术手段搭建营销反欺诈系统,以保护良好营销环境,提升营销效果。


3 方案设计


模型层面主要应用的技术有:有监督分类模型、知识图谱无监督模型、业务策略。由于欺诈形式大都是未知、复杂多样的,本方案通过数据分析及无监督检测的方式对有监督模型做补充。



4 欺诈分析:


在复杂的欺诈任务上,无法仅凭仅有的少数欺诈标签建立一个良好的欺诈模型(更何况标签质量参差不齐的),知己知彼百战不殆,这需要去了解业务知识、欺诈链,并采用更合适的技术手段来识别欺诈。


4.1 羊毛党主要类型


第一类是个人纯手工进行薅羊毛的行为,这类行为往往因涉案金额和规模小,且在商家营销的允许范围内; 第二类通过破解平台的后台接口建立虚假客户端进行薅羊毛(黑客类); 第三类利用外挂程序将薅羊毛过程完全自动化; 第四类是团伙羊毛党,通常是组织者组织团伙成员薅羊毛;(与信贷团伙不同的是,羊毛党的欺诈涉及单笔金额较小,但团伙规模较大,团伙的实际组成可能只有单个人/工作室。)


现实中,羊毛党会结合第三、四类薅羊毛方式,并存在与平台、商家瓜分利益,发展趋势更具规模化、产业化,这个是营销反欺诈的主要目标。


4.2 薅羊毛的产业链




4.3 欺诈特征


通过业务数据分析(以某银行营销活动数据为例),发现了一些羊毛党特点


  • 群控特点:每笔交易额度一样;商家集中性;活动开展短时间内交易频次高;行为序列类似;大量失败交易等;


  • 团伙性特点:团伙间有资金往来;共用设备、手机号码、IP、相似GPS等;


  • 资源端特点:代理IP、伪造GPS、伪造设备号、冒用身份证,存在大量一对多情况;


  • 兑换端特点 :集中电子券,白酒等硬通货;收货地址相似度高;


对这些特点,主要有两种应用: 1、可以加工出相关的强特征:比如活动短期内的优惠频次; 2、采用比较合适的模型去识别欺诈:如交易额度一样且频次高可以使用策略去覆盖;行为序列类似可以先用表征学习然后聚类发现;收货地址相似度高可以用WMD算法匹配高频地址群;团伙特点可以用知识图谱去挖掘黑产团伙;


5 建模过程



5.1 有监督模型



5.2 知识图谱无监督模型


主要运用知识图谱社区发现,结合异常检测发现高可疑的团伙,方法如下: 1、图谱构建:构建活动的知识图谱;



2、社区发现:先运行联通子图算法,在非孤立的子图内通过louvain社区发现算法挖掘团伙;



3、统计社区指标:如各团伙人数, 团伙人均参加活动次数,团伙内欺诈名单占比等指标;



4、检测异常社区:社区指标通过(如log, 幂)转换近似成为高斯分布,高斯异常检测算法发现异常的团伙;



5、名单核实:业务人员调查核实异常团伙名单,并将核实后名单回馈有监督模型实时训练迭代优化;



相关文章
|
7小时前
|
数据处理
使用马尔可夫链对营销中的渠道归因建模
使用马尔可夫链对营销中的渠道归因建模
|
7小时前
|
数据处理
R语言使用马尔可夫链对营销中的渠道归因建模
R语言使用马尔可夫链对营销中的渠道归因建模
|
域名解析 移动开发 搜索推荐
营销型网站建设从何做起?营销型网站建设的具体流程
营销型网站也是响应式网站,是PC、平板、手机三合一的网站,其次是要具备营销特性,将企业产品的营销体验到网站中,所以营销网站在建设方面需要考虑的因素比较多,除了对网站设计、开发的有比较高的专业要求,对网站的文案要求也比较高,网站建设的整个流程可分为以下几步。
163 0
营销型网站建设从何做起?营销型网站建设的具体流程
|
消息中间件 存储 弹性计算
【云栖号案例 | 互联网】品推宝营销内容与流程管理平台上云 减少开发周期
品推宝对上线时间和研发效率要求高,希望有自动备份的机制和容量和处理能力弹性扩展。上云后实现了业务高可用,最大程度保障了数据的安全。
|
Java PHP
营销活动送红包集成流程
功能场景说明: 商户可以根据自己的营销需求创建现金红包活动,设计大转盘游戏、刮刮卡、成为会员即送现金等丰富多彩的玩法。商户不但可以控制活动预算,还可以控制用户领取次数,领取频率等,让活动设计更贴合商户需求。
684 0
|
Python
《 营销数据科学: 用R和Python进行预测分析的建模技术》——导读
“人总会失去养育自己的一切,自然界的事物莫不如此。勇敢的人总是从容应对,静观其变,而不会溜之大吉。” ——2012年美国电影《南方的野兽》中赫什帕皮(奎温简妮·沃利斯饰) 以前的市场营销教材编写者总会推广“营销理念”,说营销既不是销售也不是买卖,而是去了解和满足顾客需求。
3178 0
|
数据库 Python
《 营销数据科学: 用R和Python进行预测分析的建模技术》——第3章 锁定目标客户
本节书摘来自华章出版社《营销数据科学:用R和Python进行预测分析的建模技术》一书中的第3章,作者:[美] 托马斯 W. 米勒(Thomas W. Miller) 著 崔立真 鹿旭东 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3979 0
|
Python
《 营销数据科学: 用R和Python进行预测分析的建模技术》——第2章 预测消费者的选择
本节书摘来自华章出版社《营销数据科学:用R和Python进行预测分析的建模技术》一书中的第2章,作者:[美] 托马斯 W. 米勒(Thomas W. Miller) 著 崔立真 鹿旭东 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2144 0
|
Python
《 营销数据科学: 用R和Python进行预测分析的建模技术》——第1章 了 解 市 场
本节书摘来自华章出版社《营销数据科学:用R和Python进行预测分析的建模技术》一书中的第1章,作者:[美] 托马斯 W. 米勒(Thomas W. Miller) 著 崔立真 鹿旭东 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3280 0