【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

简介: 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

文章目录

一、 置信度

二、 置信度 示例

参考博客 :


【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )





一、 置信度


关联规则 X ⇒ Y \rm X \Rightarrow YX⇒Y 的置信度 ,


表示 数据集 D \rm DD 中包含 X \rm XX 项集的事物 , 同时有多大可能性包含 Y \rm YY 项集 ,


等于 项集 X ∪ Y \rm X \cup YX∪Y 的支持度 与 项集 X \rm XX 的支持度 比值 ;


公式为 :


c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)







二、 置信度 示例


示例 : 数据集 D \rm DD 为 :


事物编号 事物 ( 商品 )

001 001001 奶粉 , 莴苣

002 002002 莴苣 , 尿布 , 啤酒 , 甜菜

003 003003 奶粉 , 尿布 , 啤酒 , 橙汁

004 004004 奶粉 , 莴苣 , 尿布 , 啤酒

005 005005 奶粉 , 莴苣 , 尿布 , 橙汁



求关联规则 尿 布 ⇒ 啤 酒 \rm 尿布 \Rightarrow 啤酒尿布⇒啤酒 的置信度 ? ??



根据上述公式


c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)



计算 X ⇒ Y \rm X \Rightarrow YX⇒Y 置信度 ;




1 . 计算 s u p p o r t ( X ∪ Y ) \rm support (X \cup Y)support(X∪Y) 支持度 :


S u p p o r t ( X ⇒ Y ) = S u p p o r t ( X ∪ Y ) = c o u n t ( X ∪ Y ) c o u n t ( D ) \rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)}Support(X⇒Y)=Support(X∪Y)=

count(D)

count(X∪Y)



s u p p o r t ( X ∪ Y ) \rm support (X \cup Y)support(X∪Y) 指的是 数据集 D \rm DD 中含有项集 X ∪ Y \rm X \cup YX∪Y 的事务个数 ;


含有 X ∪ Y = { 尿 布 , 啤 酒 } \rm X \cup Y=\{ 尿布 , 啤酒 \}X∪Y={尿布,啤酒} 项集的事务有 事务 2 \rm 22 , 事务 3 33 , 事务 4 44 , 得出 :


c o u n t ( X ∪ Y ) = 3 \rm count (X \cup Y) = 3count(X∪Y)=3



c o u n t ( D ) \rm count(D)count(D) 指的是 数据集 D \rm DD 的事务总数 ; 得出


c o u n t ( D ) = 5 \rm count(D) = 5count(D)=5



计算支持度结果 :


S u p p o r t ( X ⇒ Y ) = S u p p o r t ( X ∪ Y ) = c o u n t ( X ∪ Y ) c o u n t ( D ) \rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)}Support(X⇒Y)=Support(X∪Y)=

count(D)

count(X∪Y)



S u p p o r t ( X ) = S u p p o r t ( X ∪ Y ) = 3 5 \rm Support (X) = Support (X \cup Y) = \cfrac{3}{5}Support(X)=Support(X∪Y)=

5

3





2 . 计算 S u p p o r t ( X ) \rm Support (X)Support(X) 支持度 , 项集 X = { 奶 粉 } \rm X=\{ 奶粉 \}X={奶粉}



根据上述公式 S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=

count(D)

count(X)


 计算支持度 ;



c o u n t ( X ) \rm count (X)count(X) 指的是 数据集 D \rm DD 中含有项集 X \rm XX 的事务个数 ;


含有 X = { 奶 粉 } \rm X=\{ 奶粉 \}X={奶粉} 项集的事务有 事务 1 \rm 11 , 事务 3 33 , 事务 4 44 , 事务 5 55 , 得出 :


c o u n t ( X ) = 4 \rm count (X) = 4count(X)=4



c o u n t ( D ) \rm count(D)count(D) 指的是 数据集 D \rm DD 的事务总数 ; 得出


c o u n t ( D ) = 5 \rm count(D) = 5count(D)=5



则计算支持度 :


S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=

count(D)

count(X)



S u p p o r t ( X ) = 4 5 \rm Support (X) = \cfrac{4}{5}Support(X)=

5

4





3 . 求最终置信度


c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)



c o n f i d e n c e ( X ⇒ Y ) = 3 5 4 5 = 3 4 \rm confidence (X \Rightarrow Y) = \cfrac{ \dfrac{3}{5}}{\dfrac{4}{5}} = \cfrac{3}{4}confidence(X⇒Y)=

5

4


5

3



=

4

3



最终置信度为 3 4 \cfrac{3}{4}

4

3

 


目录
相关文章
|
机器学习/深度学习 运维 算法
从算法菜鸟到挖掘达人:数据挖掘的算法大冒险
从算法菜鸟到挖掘达人:数据挖掘的算法大冒险
406 18
|
11月前
|
机器学习/深度学习 数据采集 算法
数据挖掘:从数据堆里“淘金”,你的数据价值被挖掘了吗?
数据挖掘:从数据堆里“淘金”,你的数据价值被挖掘了吗?
488 12
|
11月前
|
算法 Python
Apriori算法的Python实例演示
经过运行,你会看到一些集合出现,每个集合的支持度也会给出。这些集合就是你想要的,经常一起被购买的商品组合。不要忘记,`min_support`参数将决定频繁项集的数量和大小,你可以根据自己的需要进行更改。
425 18
|
数据采集 传感器 算法
从数据中挖掘洞见:初探数据挖掘的艺术与科学
从数据中挖掘洞见:初探数据挖掘的艺术与科学
326 11
|
存储 算法 大数据
Apriori算法和Eclat算法差异
Apriori算法和Eclat算法差异
275 4
|
数据可视化 算法 前端开发
基于python flask+pyecharts实现的中药数据可视化大屏,实现基于Apriori算法的药品功效关系的关联规则
本文介绍了一个基于Python Flask和Pyecharts实现的中药数据可视化大屏,该系统应用Apriori算法挖掘中药药材与功效之间的关联规则,为中医药学研究提供了数据支持和可视化分析工具。
689 2
|
SQL 开发框架 大数据
【数据挖掘】顺丰科技2022年秋招大数据挖掘与分析工程师笔试题
顺丰科技2022年秋招大数据挖掘与分析工程师笔试题解析,涵盖了多领域选择题和编程题,包括动态规划、数据库封锁协议、概率论、SQL、排序算法等知识点。
459 0

热门文章

最新文章