基于关系的违规团伙发掘风控方案-阿里云开发者社区

开发者社区> 傲海> 正文

基于关系的违规团伙发掘风控方案

简介: 目前很多平台方都有团伙作案的情况发生,比如团伙性薅羊毛,比如团伙性的制造一些虚假信息,团伙性发送违法广告。之所以是团伙性作案,因为作案人员之间有某种关系连接。当业务方获取了人员关系之后,能否成功挖掘出违规团伙,关系到平台的安全。
+关注继续查看

业务背景

目前很多平台方都有团伙作案的情况发生,比如团伙性薅羊毛,比如团伙性的制造一些虚假信息,团伙性发送违法广告。之所以是团伙性作案,因为作案人员之间有某种关系连接。当业务方获取了人员关系之后,能否成功挖掘出违规团伙,关系到平台的安全。

业务痛点

绝大部分客户可以通过SNS留言、转账、通话等数据构建出用户关系网络,并且可以甄别出网络中部分违规客户,缺乏有效的智能化的方案对全网所有客户进行是否违规的判断。

解决方案

PAI平台提供了一套基于关系图挖掘的的算法,包含标签传播、最大联通子图等经典图算法

1.人力要求:需要具备基础的图挖掘算法背景、懂得关系型数据的构建模式

2.开发周期:1-2天

3.数据要求:可以将数据构建成点边点的模式,点指的是每个用户,边指的是某种关系(关系可以是通话、转账、留言等等)

数据说明

下图是已知的一份人物通联关系图,每两个人之间的连线表示两人有一定关系,可以是同事或者亲人关系等。已知“Enoch”是信用用户,“Evan”是欺诈用户。需要通过图算法,计算出其它人的信用指数,即得到图中每个人是欺诈用户的概率。这个数据可以方便相关机构做风控。

)

上图对应的数据集如下,上图是个有向图,每个点代表一个人,每个人都是一个start_point,每个start_point都连接一个end_point。count表示start_point和end_point的连线,count值越大说明start_point和end_point这两个人的关系越密切。

特征数据:

参数名称 参数描述
start_point 用户A,每个关系连线的起点
end_point 用户B,每个关系连线的终点
count 用户A和用户B的关系程度

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1. 最大联通子图

最大联通子图的功能:图算法的输入数据是关系图谱结构的,最大联通子图可以找到有通联关系的最大集合,在团伙发现的场景中可以排除掉一些与风控场景无关的人。
本次实验通过最大联通子图组件将数据中的群体分为两部分,并赋予group_id。通过SQL脚本组件和JOIN组件去除下图中的无关联人员。

2. 单源最短路径

通过单源最短路径组件探查出每个人的一度人脉、二度人脉等关系。“distance”表示“Enoch”通过几个人可以联络到目标人,如下图所示:

3. 标签传播分类

标签传播分类算法为半监督的分类算法,原理是用已标记节点的标签信息去预测未标记节点的标签信息。在算法执行过程中,每个节点的标签按相似度传播给相邻节点。
使用标签传播分类组件除了需要所有人员的通联图数据以外,还要有人员打标数据。本实验通过已知数据(读数据表)组件导入打标数据(“weight”表示目标是欺诈用户的概率),如下图所示:

4. 结论

通过SQL脚本组件对结果进行筛选,最终展现的是每个人涉嫌欺诈的概率,数值越大表示是欺诈用户的概率越大,如下图所示:

总结

通过PAI-Studio内置的基于关系的违规团伙发掘方案可以基于用户的关系网络自动识别出全网每个用户的风险值,做到违规团伙智能化挖掘的作用,常被应用到金融、社交、电信等行业。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
8656 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10483 0
使用SSH远程登录阿里云ECS服务器
远程连接服务器以及配置环境
2297 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
12300 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
4573 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
6634 0
阿里云服务器ECS登录用户名是什么?系统不同默认账号也不同
阿里云服务器Windows系统默认用户名administrator,Linux镜像服务器用户名root
3745 0
+关注
傲海
著有《机器学习实践应用》,阿里云机器学习PAI产品经理,个人微信公众号“凡人机器学习”。
302
文章
10
问答
来源圈子
更多
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载