KNIMI数据挖掘建模与分析系列_003_利用KNIMI做客户细分

简介: 利用KNIMI做客户细分老帅 20150801http://blog.csdn.net/shuaihj一、测试数据              需要测试数据,请留下邮箱 二、计算消费金额和消费次数1.

利用KNIMI做客户细分

老帅

20150801

http://blog.csdn.net/shuaihj

一、测试数据

            

需要测试数据,请留下邮箱

 二、计算消费金额和消费次数

1.读入(销售数据.csv)

读取列标题

2. 时间格式转换

按指定时间格式识别“订单创建日期”列

3.对金额分组加和

依据客户编号对”销售金额”加和

 

4.字段重命名更可读

统计结果


5. 对订单分组计数

依据客户编号对”销售订单编号”进行去重加和


6.字段重命名更可读


统计结果

7.连接查询客户的消费金额和消费次数

设置连接方式和关键列

8.统计结果

9.数据流

三、计算多少天没消费了

1.最近一次消费时间

依据客户编号对订单创建日期取最大值

2.多少天没消费了

计算客户最近一次消费,距离“2014年1月31日”有“多少天没消费了”

3.过滤无用字段


4.统计结果

5.数据流

四、根据销售数据对客户进行层次聚类计算

1.连接查询客户的消费信息

设置连接方式和关键列

查询结果

2.聚类计算前标准化

设置需要标准化的列和标准化算法

标准化结果

3.计算层次聚类

指定“距离函数”、“连接类型”以及参与聚类计算的列

分层聚类结果

4.去掉噪声数据(全局)

放大层次聚类图

选中噪声点并设置为噪声

在全局过滤噪声数据

查看被过滤掉的数据

5.数据流


四、根据销售数据对客户进行k-Means聚类计算

1.计算k-Means聚类

指定聚类参数及参与聚类计算的列

查看聚类结果

2.根据聚类结果指派数据

(也就是根据训练模型测试真实数据)

查看聚类结果

3.决策树训练

设置决策树参数

查看训练结果

4.数据流

相关文章
|
1月前
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
本文总结了2023年第十一届泰迪杯数据挖掘挑战赛A题的新冠疫情防控数据分析,提供了32页和40页的论文以及实现代码,涉及密接者追踪、疫苗接种影响分析、重点场所管控以及疫情趋势研判等多个方面,运用了机器学习算法和SEIR传染病模型等方法。
33 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
|
1月前
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
本文介绍了2023年第十一届泰迪杯数据挖掘挑战赛A题的解题思路和Python代码实现,涵盖了新冠疫情防控数据的分析、建模方案以及数据治理的具体工作。
40 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
|
1月前
|
数据采集 自然语言处理 数据可视化
基于python数据挖掘在淘宝评价方面的应用与分析,技术包括kmeans聚类及情感分析、LDA主题分析
本文探讨了基于Python数据挖掘技术在淘宝评价分析中的应用,涵盖了数据采集、清洗、预处理、评论词频分析、情感分析、聚类分析以及LDA主题建模和可视化,旨在揭示淘宝客户评价中的潜在模式和情感倾向,为商家和消费者提供决策支持。
|
1月前
|
数据采集 自然语言处理 数据可视化
基于Python的社交媒体评论数据挖掘,使用LDA主题分析、文本聚类算法、情感分析实现
本文介绍了基于Python的社交媒体评论数据挖掘方法,使用LDA主题分析、文本聚类算法和情感分析技术,对数据进行深入分析和可视化,以揭示文本数据中的潜在主题、模式和情感倾向。
|
1月前
|
SQL 开发框架 大数据
【数据挖掘】顺丰科技2022年秋招大数据挖掘与分析工程师笔试题
顺丰科技2022年秋招大数据挖掘与分析工程师笔试题解析,涵盖了多领域选择题和编程题,包括动态规划、数据库封锁协议、概率论、SQL、排序算法等知识点。
55 0

热门文章

最新文章