用户流失预警风控-阿里云开发者社区

开发者社区> 阿里云机器学习> 正文

用户流失预警风控

简介: 在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务背景

在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务痛点

目前用户流失预警监控是业内主流的需求之一,但是缺少智能化的预测手段和机制。目前主流的一些预警方案都是基于一些规则的方案,对于一些潜在可能流失的用户没有很准确的发掘手段。

解决方案

PAI平台提供了一套基于打标数据的特征编码、分类模型训练、模型评估的方案。

1.人力要求:需要具备基础的建模背景知识

2.开发周期:1-2天

3.数据要求:最好有超过千条的打标数据,打标哪些客户在哪种特征情况下流失过,数据越多效果越好

数据说明

数据来自真实的电信领域客户行为数据,包含用户的基本属性以及用户是否会流失,数据一共7043个用户样本。

特征数据:

参数名称 参数描述
customerid 用户ID
gender 性别
SeniorCitizen 是否是个市民,1是,0不是
Partner 是否有Partner
Dependents 是否有从属关系
tenure 客户在这个公司使用的时长
PhoneService 是否有手机服务
MultipleLine 是否有多条线路
InternetService 互联网服务商DSL、Fiber optic、No
OnlineSecurity 是否有互联网在线安全问题
OnlineBackup 是否有线上支持
DeviceProtection 是否有服务保护
TechSupport 是否申请过技术支持
StreamingTV 是否有流TV
StreamingMovies 是否有流电影
Contract 合同时限,Month-to-month、Two year
PaperlessBilling 是否有电子账单
PaymentMethod 付款方式
MonthlyCharges 月消费
TotalCharges 总消费

目标数据:

参数名称 参数描述
churn 用户是否流式

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1.数据源

上文提到的用户流式用户的数据

2.特征编码

通过One-hot以及SQL组件实现特征工程建模,将原始的字符型特征转为数值型特征。

以目标字段churn为例,原始数据是“Yes”和“No”,可以通过SQL语句把"Yes"变为1,“No”变为0:

select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

3.模型训练

将数据分成两部分,一部分作为训练集训练模型,另一部分做预测集验证模型效果。用户流失预警是个二分类问题,一个用户只有流失和不流失两种可能性。所以选用二分类算法来处理,生成的分类模型可以一键部署为RestfulAPI服务供业务方调用。

4.模型效果验证

通过二分类评估组件验证模型准确性,准确性描述指标AUC可以达到0.83,也就是说预测的准确性在80%左右。

总结

用户流失预警是所有B端客户都可能应用到的场景,PAI提供了一套完整的基于用户特征的算法,可以帮助客户在1-2天快速实现用户流失模型的训练,大大提速了整个实验搭建的周期。>

版权声明:本文中所有内容均属于阿里云开发者社区所有,任何媒体、网站或个人未经阿里云开发者社区协议授权不得转载、链接、转贴或以其他方式复制发布/发表。申请授权请邮件developerteam@list.alibaba-inc.com,已获得阿里云开发者社区协议授权的媒体、网站,在转载使用时必须注明"稿件来源:阿里云开发者社区,原文作者姓名",违者本社区将依法追究责任。 如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developer2020@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
阿里云机器学习
使用钉钉扫一扫加入圈子
+ 订阅

官方博客
官网链接