用户流失预警风控

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务背景

在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。

业务痛点

目前用户流失预警监控是业内主流的需求之一,但是缺少智能化的预测手段和机制。目前主流的一些预警方案都是基于一些规则的方案,对于一些潜在可能流失的用户没有很准确的发掘手段。

解决方案

PAI平台提供了一套基于打标数据的特征编码、分类模型训练、模型评估的方案。

1.人力要求:需要具备基础的建模背景知识

2.开发周期:1-2天

3.数据要求:最好有超过千条的打标数据,打标哪些客户在哪种特征情况下流失过,数据越多效果越好

数据说明

数据来自真实的电信领域客户行为数据,包含用户的基本属性以及用户是否会流失,数据一共7043个用户样本。

特征数据:

参数名称 参数描述
customerid 用户ID
gender 性别
SeniorCitizen 是否是个市民,1是,0不是
Partner 是否有Partner
Dependents 是否有从属关系
tenure 客户在这个公司使用的时长
PhoneService 是否有手机服务
MultipleLine 是否有多条线路
InternetService 互联网服务商DSL、Fiber optic、No
OnlineSecurity 是否有互联网在线安全问题
OnlineBackup 是否有线上支持
DeviceProtection 是否有服务保护
TechSupport 是否申请过技术支持
StreamingTV 是否有流TV
StreamingMovies 是否有流电影
Contract 合同时限,Month-to-month、Two year
PaperlessBilling 是否有电子账单
PaymentMethod 付款方式
MonthlyCharges 月消费
TotalCharges 总消费

目标数据:

参数名称 参数描述
churn 用户是否流式

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1.数据源

上文提到的用户流式用户的数据

2.特征编码

通过One-hot以及SQL组件实现特征工程建模,将原始的字符型特征转为数值型特征。

以目标字段churn为例,原始数据是“Yes”和“No”,可以通过SQL语句把"Yes"变为1,“No”变为0:

select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

3.模型训练

将数据分成两部分,一部分作为训练集训练模型,另一部分做预测集验证模型效果。用户流失预警是个二分类问题,一个用户只有流失和不流失两种可能性。所以选用二分类算法来处理,生成的分类模型可以一键部署为RestfulAPI服务供业务方调用。

4.模型效果验证

通过二分类评估组件验证模型准确性,准确性描述指标AUC可以达到0.83,也就是说预测的准确性在80%左右。

总结

用户流失预警是所有B端客户都可能应用到的场景,PAI提供了一套完整的基于用户特征的算法,可以帮助客户在1-2天快速实现用户流失模型的训练,大大提速了整个实验搭建的周期。>

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
关系型数据库 MySQL 定位技术
高德地图、百度地图的经纬度科普|MySQL和编程语言是如何计算两个坐标之间的距离?
高德地图、百度地图的经纬度科普|MySQL和编程语言是如何计算两个坐标之间的距离?
758 0
高德地图、百度地图的经纬度科普|MySQL和编程语言是如何计算两个坐标之间的距离?
|
Docker 容器
Docker中运行Dockerfile时报错“cannot allocate memory”
Docker中运行Dockerfile时报错“cannot allocate memory”
776 0
|
9月前
|
Java 索引
Java“StringIndexOutOfBoundsException”解决
Java中“StringIndexOutOfBoundsException”异常通常在字符串索引超出其边界时抛出。解决方法包括检查字符串长度、确保索引值有效,以及使用条件语句避免越界访问。
490 2
|
9月前
|
存储 关系型数据库 数据库
在Python中优雅地打开和操作RDS
在Python中优雅地打开和操作RDS
148 2
|
9月前
|
数据采集 人工智能 自然语言处理
文档智能 & RAG让AI大模型更懂业务
文档智能 & RAG让AI大模型更懂业务
|
10月前
|
机器学习/深度学习 数据采集 网络安全
使用Python实现深度学习模型:智能网络安全威胁检测
使用Python实现深度学习模型:智能网络安全威胁检测
585 6
|
8月前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的联机重做日志文件与数据写入过程
在Oracle数据库中,联机重做日志文件记录了数据库的变化,用于实例恢复。每个数据库有多组联机重做日志,每组建议至少有两个成员。通过SQL语句可查看日志文件信息。视频讲解和示意图进一步解释了这一过程。
130 0
|
Ubuntu
基于Ubuntu坏境下的Suricata坏境搭建
至此,你已经在Ubuntu环境下搭建好了Suricata环境。
135 2
|
NoSQL 架构师 Java
2024软考架构师考试---分布式锁的实现方式有那些以及优缺点
【6月更文挑战第16天】在分布式系统中,分布式锁是一种用于控制对共享资源访问的机制,以确保多进程、多线程环境下的数据一致性。分布式锁有多种实现方式,本文将介绍几种常见的分布式锁及其优缺点。
425 1
IDEA创建Java9模块没有module-info.java的解决办法
IDEA创建Java9模块没有module-info.java的解决办法
948 0
IDEA创建Java9模块没有module-info.java的解决办法

热门文章

最新文章