用户流失预警风控

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务背景

在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务痛点

目前用户流失预警监控是业内主流的需求之一,但是缺少智能化的预测手段和机制。目前主流的一些预警方案都是基于一些规则的方案,对于一些潜在可能流失的用户没有很准确的发掘手段。

解决方案

PAI平台提供了一套基于打标数据的特征编码、分类模型训练、模型评估的方案。

1.人力要求:需要具备基础的建模背景知识

2.开发周期:1-2天

3.数据要求:最好有超过千条的打标数据,打标哪些客户在哪种特征情况下流失过,数据越多效果越好

数据说明

数据来自真实的电信领域客户行为数据,包含用户的基本属性以及用户是否会流失,数据一共7043个用户样本。

特征数据:

参数名称 参数描述
customerid 用户ID
gender 性别
SeniorCitizen 是否是个市民,1是,0不是
Partner 是否有Partner
Dependents 是否有从属关系
tenure 客户在这个公司使用的时长
PhoneService 是否有手机服务
MultipleLine 是否有多条线路
InternetService 互联网服务商DSL、Fiber optic、No
OnlineSecurity 是否有互联网在线安全问题
OnlineBackup 是否有线上支持
DeviceProtection 是否有服务保护
TechSupport 是否申请过技术支持
StreamingTV 是否有流TV
StreamingMovies 是否有流电影
Contract 合同时限,Month-to-month、Two year
PaperlessBilling 是否有电子账单
PaymentMethod 付款方式
MonthlyCharges 月消费
TotalCharges 总消费

目标数据:

参数名称 参数描述
churn 用户是否流式

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1.数据源

上文提到的用户流式用户的数据

2.特征编码

通过One-hot以及SQL组件实现特征工程建模,将原始的字符型特征转为数值型特征。

以目标字段churn为例,原始数据是“Yes”和“No”,可以通过SQL语句把"Yes"变为1,“No”变为0:

select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

3.模型训练

将数据分成两部分,一部分作为训练集训练模型,另一部分做预测集验证模型效果。用户流失预警是个二分类问题,一个用户只有流失和不流失两种可能性。所以选用二分类算法来处理,生成的分类模型可以一键部署为RestfulAPI服务供业务方调用。

4.模型效果验证

通过二分类评估组件验证模型准确性,准确性描述指标AUC可以达到0.83,也就是说预测的准确性在80%左右。

总结

用户流失预警是所有B端客户都可能应用到的场景,PAI提供了一套完整的基于用户特征的算法,可以帮助客户在1-2天快速实现用户流失模型的训练,大大提速了整个实验搭建的周期。>

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
30天前
|
监控 数据管理
治理工作台升级,可手动录入质量问题,实现反馈有渠道、整改可跟踪
Dataphin V4.0版本升级治理工作台,支持手动录入数据质量问题,新增对“标签”对象的问题管理,并且可对问题进行分类。问题清单和整改流程也进行了优化,手动录入的问题和自动识别的问题可统一整改追踪,并提供操作记录,以增强数据质量管理的响应速度和效率。
253 2
|
数据管理
外呼系统从三个维度提升电销业绩
外呼系统从三个维度提升电销业绩
202 0
外呼系统从三个维度提升电销业绩
2023年春运(春节)舆情风险点研判提示分析
随着农历春节临近,根据国务院《2023年综合运输春运疫情防控和运输服务保障总体工作方案》通知,2023年综合运输春运从1月7日开始,至2月15日结束,共40天。
2023年春运(春节)舆情风险点研判提示分析
|
机器学习/深度学习 数据采集 算法
大数据分析案例-对电信客户流失分析预警预测
大数据分析案例-对电信客户流失分析预警预测
1224 0
大数据分析案例-对电信客户流失分析预警预测
|
SQL 云安全 机器学习/深度学习
安全风险预警!你的网站真的安全吗?
安全风险预警!你的网站真的安全吗?
310 3
安全风险预警!你的网站真的安全吗?
|
机器学习/深度学习 数据采集 Python
实战案例|金融行业客户流失预警模型~
大家好,我是志斌~ 今天跟大家分享一下逻辑回归模型在商业实战中的应用。
820 0
实战案例|金融行业客户流失预警模型~
|
机器学习/深度学习 搜索推荐 算法
流失客户预测及营销方案(源码)
流失客户预测及营销方案(源码)
|
监控 数据可视化 搜索推荐
舆情口碑信息如何监测收集?
舆情口碑指的是围绕某一对象展开的网络评价的集合,其对象既有可能是企业,也有可能是政府机关,还有可能是公众人物或具体到某件事、某场活动、某个话题。
|
数据挖掘 PHP C语言
R 银行信用卡风控评分数据分析
R 银行信用卡风控评分数据分析
180 0
R 银行信用卡风控评分数据分析
|
机器学习/深度学习 数据采集 算法
某运营商客户流失分析
当今时代,价值客户不仅是电信企业的宝贵资源, 也是其竞争对手不断争取的对象。据某运营商的统计数据显示,每个季度的客户流失现象非常严重。这使得移动运营商不得不关注客户流失管理。本项目主要通过对某运营商第一季度统计数据,运用机器学习算法进行建模与预测,预测出用户是否流失,帮助运营商更好的了解流失客户,以便于采取有力措施防止客户流失。
620 0
某运营商客户流失分析