KNIMI数据挖掘建模与分析系列_004_利用KNIMI做客户流失预测

简介: 利用KNIMI做客户流失预测老帅 20150801http://blog.csdn.net/shuaihj一、测试数据中国移动客服数据需要测试数据,请留下邮箱 二、统计已流失客户1.

利用KNIMI做客户流失预测

老帅

20150801

http://blog.csdn.net/shuaihj

一、测试数据

中国移动客服数据


需要测试数据,请留下邮箱

二、统计已流失客户

1.读取移动客服数据(客户流失.xlsx)

2.统计已流失客户

参数设置

统计结果


3.数据流

三、贝叶斯预测客户流失

1.字符类型转换

将“流失”列转换为字符串类型

2.划分训练集和测试集

取30%作为训练数据,剩余70%作为测试数据,我们将预测这70%客户的流失率;

设置“流失”数据为统计样本

3. 贝叶斯训练

指定“分类列”、“默认概率”、“每个属性的最大标称值数量”

训练结果

4.贝叶斯预测

对70%测试数据进行预测,结果如下:

5.模型评估

根据“真实流失”和“预测流失”数据评估模型

6.数据流

四、决策树预测客户流失

1.决策树训练

参数设置

训练结果

2.决策树预测

对70%测试数据进行预测,结果如下:

3.模型评估

根据“真实流失”和“预测流失”数据评估模型

4.数据流

五、最近邻预测客户流失

1.最近邻预测

参数设置

2.模型评估

根据“真实流失”和“预测流失”数据评估模型

3.数据流

相关文章
|
3月前
|
自然语言处理 算法 数据挖掘
【数据挖掘】十大算法之PageRank连接分析算法
文章介绍了PageRank算法的基本概念和数学模型,包括如何通过一阶马尔科夫链定义随机游走模型以及如何计算网页的重要性评分,并提供了PageRank迭代算法的具体步骤。
74 0
|
3月前
|
数据采集 自然语言处理 数据可视化
基于Python的社交媒体评论数据挖掘,使用LDA主题分析、文本聚类算法、情感分析实现
本文介绍了基于Python的社交媒体评论数据挖掘方法,使用LDA主题分析、文本聚类算法和情感分析技术,对数据进行深入分析和可视化,以揭示文本数据中的潜在主题、模式和情感倾向。
168 0
|
3月前
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
本文总结了2023年第十一届泰迪杯数据挖掘挑战赛A题的新冠疫情防控数据分析,提供了32页和40页的论文以及实现代码,涉及密接者追踪、疫苗接种影响分析、重点场所管控以及疫情趋势研判等多个方面,运用了机器学习算法和SEIR传染病模型等方法。
66 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
|
3月前
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
本文介绍了2023年第十一届泰迪杯数据挖掘挑战赛A题的解题思路和Python代码实现,涵盖了新冠疫情防控数据的分析、建模方案以及数据治理的具体工作。
76 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
|
3月前
|
数据采集 自然语言处理 数据可视化
基于python数据挖掘在淘宝评价方面的应用与分析,技术包括kmeans聚类及情感分析、LDA主题分析
本文探讨了基于Python数据挖掘技术在淘宝评价分析中的应用,涵盖了数据采集、清洗、预处理、评论词频分析、情感分析、聚类分析以及LDA主题建模和可视化,旨在揭示淘宝客户评价中的潜在模式和情感倾向,为商家和消费者提供决策支持。
|
3月前
|
SQL 开发框架 大数据
【数据挖掘】顺丰科技2022年秋招大数据挖掘与分析工程师笔试题
顺丰科技2022年秋招大数据挖掘与分析工程师笔试题解析,涵盖了多领域选择题和编程题,包括动态规划、数据库封锁协议、概率论、SQL、排序算法等知识点。
91 0
|
3月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】PCA 主成分分析算法过程及原理讲解
主成分分析(PCA)的原理和算法过程。
76 0

热门文章

最新文章

下一篇
无影云桌面