【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )

简介: 【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )

文章目录

一、 Apriori 算法过程

二、 Apriori 算法示例



参考博客 :


【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )





一、 Apriori 算法过程




原始数据集 D \rm DD ,


1 11 项集 C 1 \rm C_1C

1


 , 2 22 项集 C 2 \rm C_2C

2


 , ⋯ \cdots⋯ , k \rm kk 项集 C k \rm C_kC

k


 , 这些项集都是候选项集 ,



根据 原始数据集 D \rm DD , 创造 1 11 项集 C 1 \rm C_1C

1


 , 然后对 C 1 \rm C_1C

1


 执行 数据集扫描函数 , 找到其中的 频繁 1 11 项集 L 1 \rm L_1L

1


 ,


根据 频繁 1 11 项集 L 1 \rm L_1L

1


 , 创造 2 22 项集 C 2 \rm C_2C

2


 , 然后对 C 2 \rm C_2C

2


 执行 数据集扫描函数 , 找到其中的 频繁 2 22 项集 L 2 \rm L_2L

2


 ,


⋮ \vdots


根据 频繁 k − 1 \rm k-1k−1 项集 L k − 1 \rm L_{k-1}L

k−1


 , 创造 k \rm kk 项集 C k \rm C_kC

k


 , 然后对 C k \rm C_kC

k


 执行 数据集扫描函数 , 找到其中的 频繁 k \rm kk 项集 L k \rm L_kL

k


 ,






二、 Apriori 算法示例



事物编号 事物 ( 商品 )

001 001001 奶粉 , 莴苣

002 002002 莴苣 , 尿布 , 啤酒 , 甜菜

003 003003 奶粉 , 尿布 , 啤酒 , 橙汁

004 004004 奶粉 , 莴苣 , 尿布 , 啤酒

005 005005 奶粉 , 莴苣 , 尿布 , 橙汁


最小支持度阈值为 m i n s u p = 0.6 \rm minsup= 0.6minsup=0.6



根据 原始数据集 D \rm DD , 创造 1 11 项集 C 1 \rm C_1C

1


 , 然后对 C 1 \rm C_1C

1


 执行 数据集扫描函数 , 找到其中的 频繁 1 11 项集 L 1 \rm L_1L

1


 ,


1 11 项集 { 奶 粉 } \{ 奶粉 \}{奶粉} 支持度 0.8 0.80.8

1 11 项集 { 莴 苣 } \{ 莴苣 \}{莴苣} 支持度 0.8 0.80.8

1 11 项集 { 尿 布 } \{ 尿布 \}{尿布} 支持度 0.8 0.80.8

1 11 项集 { 啤 酒 } \{ 啤酒 \}{啤酒} 支持度 0.6 0.60.6

1 11 项集 { 甜 菜 } \{ 甜菜 \}{甜菜} 支持度 0.2 0.20.2

1 11 项集 { 诚 挚 } \{ 诚挚 \}{诚挚} 支持度 0.4 0.40.4


1 11 项集中只有 { 奶 粉 } \{ 奶粉 \}{奶粉} , { 莴 苣 } \{ 莴苣 \}{莴苣} , { 尿 布 } \{ 尿布 \}{尿布} , { 啤 酒 } \{ 啤酒 \}{啤酒} 是频繁 1 11 项集 ;



根据 频繁 1 11 项集 L 1 \rm L_1L

1


 , 创造 2 22 项集 C 2 \rm C_2C

2


 , 然后对 C 2 \rm C_2C

2


 执行 数据集扫描函数 , 找到其中的 频繁 2 22 项集 L 2 \rm L_2L

2


 ,


2 22 项集 { 奶 粉 , 莴 苣 } \{ 奶粉 , 莴苣 \}{奶粉,莴苣} 支持度 0.6 0.60.6

2 22 项集 { 莴 苣 , 尿 布 } \{ 莴苣 , 尿布 \}{莴苣,尿布} 支持度 0.6 0.60.6

2 22 项集 { 莴 苣 , 啤 酒 } \{ 莴苣 , 啤酒 \}{莴苣,啤酒} 支持度 0.4 0.40.4

2 22 项集 { 尿 布 , 啤 酒 } \{ 尿布 , 啤酒 \}{尿布,啤酒} 支持度 0.8 0.80.8

2 22 项集 { 奶 粉 , 尿 布 } \{ 奶粉 , 尿布 \}{奶粉,尿布} 支持度 0.6 0.60.6

2 22 项集 { 奶 粉 , 啤 酒 } \{ 奶粉 , 啤酒 \}{奶粉,啤酒} 支持度 0.4 0.40.4


2 22 项集中只有 { 奶 粉 , 尿 布 } \{ 奶粉 , 尿布 \}{奶粉,尿布} , { 尿 布 , 啤 酒 } \{ 尿布 , 啤酒 \}{尿布,啤酒} , { 莴 苣 , 尿 布 } \{ 莴苣 , 尿布 \}{莴苣,尿布} , { 奶 粉 , 莴 苣 } \{ 奶粉 , 莴苣 \}{奶粉,莴苣} 是 频繁 2 22 项集 ;



根据 频繁 2 22 项集 L 1 \rm L_1L

1


 , 创造 3 33 项集 C 3 \rm C_3C

3


 , 然后对 C 3 \rm C_3C

3


 执行 数据集扫描函数 , 找到其中的 频繁 3 33 项集 L 3 \rm L_3L

3


 ,


3 33 项集 { 奶 粉 , 莴 苣 , 尿 布 } \{ 奶粉 , 莴苣 , 尿布 \}{奶粉,莴苣,尿布} 支持度 0.4 0.40.4

3 33 项集 { 奶 粉 , 莴 苣 , 啤 酒 } \{ 奶粉 , 莴苣 , 啤酒 \}{奶粉,莴苣,啤酒} 支持度 0.2 0.20.2

3 33 项集 { 莴 苣 , 尿 布 , 啤 酒 } \{ 莴苣 , 尿布 , 啤酒 \}{莴苣,尿布,啤酒} 支持度 0.4 0.40.4

3 33 项集 { 奶 粉 , 尿 布 , 啤 酒 } \{ 奶粉 , 尿布 , 啤酒 \}{奶粉,尿布,啤酒} 支持度 0.4 0.40.4


3 33 项集中没有频繁项集 ;


目录
相关文章
|
机器学习/深度学习 运维 算法
从算法菜鸟到挖掘达人:数据挖掘的算法大冒险
从算法菜鸟到挖掘达人:数据挖掘的算法大冒险
451 18
|
机器学习/深度学习 数据采集 算法
数据挖掘:从数据堆里“淘金”,你的数据价值被挖掘了吗?
数据挖掘:从数据堆里“淘金”,你的数据价值被挖掘了吗?
540 12
|
算法 Python
Apriori算法的Python实例演示
经过运行,你会看到一些集合出现,每个集合的支持度也会给出。这些集合就是你想要的,经常一起被购买的商品组合。不要忘记,`min_support`参数将决定频繁项集的数量和大小,你可以根据自己的需要进行更改。
478 18
|
数据采集 传感器 算法
从数据中挖掘洞见:初探数据挖掘的艺术与科学
从数据中挖掘洞见:初探数据挖掘的艺术与科学
378 11
|
存储 算法 大数据
Apriori算法和Eclat算法差异
Apriori算法和Eclat算法差异
302 4
|
8月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
735 0
|
8月前
|
数据采集 分布式计算 并行计算
mRMR算法实现特征选择-MATLAB
mRMR算法实现特征选择-MATLAB
468 2
|
9月前
|
传感器 机器学习/深度学习 编解码
MATLAB|主动噪声和振动控制算法——对较大的次级路径变化具有鲁棒性
MATLAB|主动噪声和振动控制算法——对较大的次级路径变化具有鲁棒性
379 3
|
8月前
|
机器学习/深度学习 算法 机器人
使用哈里斯角Harris和SIFT算法来实现局部特征匹配(Matlab代码实现)
使用哈里斯角Harris和SIFT算法来实现局部特征匹配(Matlab代码实现)
362 8
|
8月前
|
机器学习/深度学习 算法 自动驾驶
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
416 8

热门文章

最新文章