开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:如何基于 PAI 实现用户流失召回】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/855/detail/14102
如何基于 PAI 实现用户流失召回
一、 PAI 解决用户流失召回
1、介绍 PAI 流失召回解决方案
介绍 PAI 流失召回的解决方案,利用M型基于用户数据,对于即将流失的用户进行预测,计算一个分值,分值越高表明越容易流失的用户,则我们可以进行提前对于用户流失进行一个干预。
这个流程其实就是数据的 PAI ,如下图是原始表,是一个用户的买点数据,在表中可以看到用户的 ID ,和一些行为的数据,例如是不是新装的或者是否用 WIFI ,它的地点。
2、数据处理分析
第一阶段进行数据处理,首先写明注册日期,通过 CYCLE 脚本计算。当使用其他的算法组件的时候,可以进行选择并且拖拽到画布上,做一个拼接和设置参数。然后把新建的注册日期和原始表汇总到一起作出一条命令,就完成了第一步的数据准备。通过原始数据计算出用户的真实注册的信息。
第二阶段把数据分成两份,一份进行测试,一份进行训练,也是通过分区的方式。例如把10月27日之前的数据作为一个训练值,10月27日之后的数据作为一个测试值。在训练过程中应先选一个特征,这个特征通过 CYCLE 组件进行详细的处理,通过 count ,max 相关的字段,再利用 groupspile 变为以每一个用户作为样本进行整个特征的构建。
3、添加数据 able
接下来需要添加数据的able ,把用户注册之后在8天内没有登陆的就当成一个流失用户,在8天内登录的为非流失用户。如此构建了一套执行训练的数据。第一列是用户的 ID ,把所有的对错全部数据化,在最后一列是数据流失的,0是非流失的,1是流失的。
4、利用二分倍场景
进入到标准的二分倍场景,用 one-hot 进行编码,再运用逻辑回归二分类对用户的进行训练模型,将模型输入到预测组件,再把测试数据用 one-hot 编码输入测试组件,就可以对每一个待测数据进行预测,如表展示了每一用户进行流失的概率分,1就表示将来为流失用户,对于 prediction_score 的数值越高,则用户流失的概率越高。
5、真实数据与测试数据比对并分析
因为已经知道是否为流失用户,所以可以拿真实数据与测试数据进行比较,就可以判断建模是否为准确的。通常可以判断 AUC 指标越接近1,则表示和真实数值越接近。
也可以看 ROC 组件,所构成的面积越大,说明预测结果和真实值越接近
通过整套流程的完成以及原始数据的标签加工,特征加工,建立模型以及模型的预测,拿到了每个用户的流失的概率分,那可以通过概率分对即将流失的用户进行干预,其中一种对于用户流失的挽回手段就是发出短信,可以在此直接购买短信的触达书,在用户触达配置里对于短信的签名、模板进行配置,而且可以添加一个发布计划,将刚刚计算出的结果,放到发布计划的导入号码里进行一个上传,就可以进行一个发布计划,通过短信去触达用户从而将用户及时召回。如此就是对于整个用户流失召回计划的一个建模和用户触达的整套方案.