如何基于 PAI 实现用户流失召回|学习笔记

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 快速学习如何基于 PAI 实现用户流失召回。

开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:如何基于 PAI 实现用户流失召回】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/855/detail/14102


如何基于 PAI 实现用户流失召回

 

一、 PAI 解决用户流失召回

1、介绍 PAI 流失召回解决方案

介绍  PAI 流失召回的解决方案,利用M型基于用户数据,对于即将流失的用户进行预测,计算一个分值,分值越高表明越容易流失的用户,则我们可以进行提前对于用户流失进行一个干预。

这个流程其实就是数据的 PAI ,如下图是原始表,是一个用户的买点数据,在表中可以看到用户的 ID ,和一些行为的数据,例如是不是新装的或者是否用 WIFI ,它的地点。

image.png

2、数据处理分析

第一阶段进行数据处理,首先写明注册日期,通过 CYCLE 脚本计算。当使用其他的算法组件的时候,可以进行选择并且拖拽到画布上,做一个拼接和设置参数。然后把新建的注册日期和原始表汇总到一起作出一条命令,就完成了第一步的数据准备。通过原始数据计算出用户的真实注册的信息。

第二阶段把数据分成两份,一份进行测试,一份进行训练,也是通过分区的方式。例如把10月27日之前的数据作为一个训练值,10月27日之后的数据作为一个测试值。在训练过程中应先选一个特征,这个特征通过 CYCLE 组件进行详细的处理,通过 count ,max 相关的字段,再利用 groupspile 变为以每一个用户作为样本进行整个特征的构建。

image.png 

3、添加数据 able

接下来需要添加数据的able ,把用户注册之后在8天内没有登陆的就当成一个流失用户,在8天内登录的为非流失用户。如此构建了一套执行训练的数据。第一列是用户的 ID ,把所有的对错全部数据化,在最后一列是数据流失的,0是非流失的,1是流失的。

 image.png

4、利用二分倍场景

进入到标准的二分倍场景,用 one-hot 进行编码,再运用逻辑回归二分类对用户的进行训练模型,将模型输入到预测组件,再把测试数据用 one-hot 编码输入测试组件,就可以对每一个待测数据进行预测,如表展示了每一用户进行流失的概率分,1就表示将来为流失用户,对于 prediction_score 的数值越高,则用户流失的概率越高。

 image.png

5、真实数据与测试数据比对并分析

因为已经知道是否为流失用户,所以可以拿真实数据与测试数据进行比较,就可以判断建模是否为准确的。通常可以判断 AUC 指标越接近1,则表示和真实数值越接近。

image.png

也可以看 ROC 组件,所构成的面积越大,说明预测结果和真实值越接近

 image.png

通过整套流程的完成以及原始数据的标签加工,特征加工,建立模型以及模型的预测,拿到了每个用户的流失的概率分,那可以通过概率分对即将流失的用户进行干预,其中一种对于用户流失的挽回手段就是发出短信,可以在此直接购买短信的触达书,在用户触达配置里对于短信的签名、模板进行配置,而且可以添加一个发布计划,将刚刚计算出的结果,放到发布计划的导入号码里进行一个上传,就可以进行一个发布计划,通过短信去触达用户从而将用户及时召回。如此就是对于整个用户流失召回计划的一个建模和用户触达的整套方案.

image.png

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
机器学习/深度学习 编解码 计算机视觉
Python机器学习和图像处理学习笔记
Python机器学习和图像处理学习笔记
|
机器学习/深度学习 算法
学习笔记: 机器学习经典算法-决策边界(decision boundary)
机器学习经典算法-个人笔记和学习心得分享
891 0
学习笔记: 机器学习经典算法-决策边界(decision boundary)
|
机器学习/深度学习 算法 搜索推荐
【吴恩达机器学习笔记】十五、大规模机器学习
【吴恩达机器学习笔记】十五、大规模机器学习
97 0
|
机器学习/深度学习 算法
【吴恩达机器学习笔记】九、机器学习系统的设计
【吴恩达机器学习笔记】九、机器学习系统的设计
94 0
|
机器学习/深度学习 算法
【吴恩达机器学习笔记】八、应用机器学习的建议
【吴恩达机器学习笔记】八、应用机器学习的建议
116 0
|
机器学习/深度学习 算法 前端开发
学习笔记: 机器学习经典算法-集成学习策略
机器学习经典算法-个人笔记和学习心得分享
223 0
|
机器学习/深度学习 算法 Python
学习笔记: 机器学习经典算法-决策树(Decision Tress)
机器学习经典算法-个人笔记和学习心得分享
209 0
|
机器学习/深度学习 资源调度 算法
学习笔记: 机器学习经典算法-核SVM(KernelSVM)
机器学习经典算法-个人笔记和学习心得分享
164 0
|
机器学习/深度学习 资源调度 算法
学习笔记: 机器学习经典算法-线性SVM(LinearSVM)
机器学习经典算法-个人笔记和学习心得分享
162 0
|
机器学习/深度学习 算法
学习笔记: 机器学习经典算法-空间内一点到超平面的距离推广公式
机器学习经典算法-个人笔记和学习心得分享
170 0