【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )-阿里云开发者社区

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

2022-01-27 694

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

文章目录

一、置信度

二、置信度示例

参考博客 :

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

一、置信度

关联规则 X ⇒ Y \rm X \Rightarrow YX⇒Y 的置信度 ,

表示数据集 D \rm DD 中包含 X \rm XX 项集的事物 , 同时有多大可能性包含 Y \rm YY 项集 ,

等于项集 X ∪ Y \rm X \cup YX∪Y 的支持度与项集 X \rm XX 的支持度比值 ;

公式为 :

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)

二、置信度示例

示例 : 数据集 D \rm DD 为 :

事物编号事物 ( 商品 )

001 001001 奶粉 , 莴苣

002 002002 莴苣 , 尿布 , 啤酒 , 甜菜

003 003003 奶粉 , 尿布 , 啤酒 , 橙汁

004 004004 奶粉 , 莴苣 , 尿布 , 啤酒

005 005005 奶粉 , 莴苣 , 尿布 , 橙汁

求关联规则尿布 ⇒ 啤酒 \rm 尿布 \Rightarrow 啤酒尿布⇒啤酒的置信度 ? ??

根据上述公式

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)

计算 X ⇒ Y \rm X \Rightarrow YX⇒Y 置信度 ;

1 . 计算 s u p p o r t ( X ∪ Y ) \rm support (X \cup Y)support(X∪Y) 支持度 :

S u p p o r t ( X ⇒ Y ) = S u p p o r t ( X ∪ Y ) = c o u n t ( X ∪ Y ) c o u n t ( D ) \rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)}Support(X⇒Y)=Support(X∪Y)=

count(D)

count(X∪Y)

s u p p o r t ( X ∪ Y ) \rm support (X \cup Y)support(X∪Y) 指的是数据集 D \rm DD 中含有项集 X ∪ Y \rm X \cup YX∪Y 的事务个数 ;

含有 X ∪ Y = { 尿布 , 啤酒 } \rm X \cup Y=\{ 尿布 , 啤酒 \}X∪Y={尿布,啤酒} 项集的事务有事务 2 \rm 22 , 事务 3 33 , 事务 4 44 , 得出 :

c o u n t ( X ∪ Y ) = 3 \rm count (X \cup Y) = 3count(X∪Y)=3

c o u n t ( D ) \rm count(D)count(D) 指的是数据集 D \rm DD 的事务总数 ; 得出

c o u n t ( D ) = 5 \rm count(D) = 5count(D)=5

计算支持度结果 :

count(D)

count(X∪Y)

S u p p o r t ( X ) = S u p p o r t ( X ∪ Y ) = 3 5 \rm Support (X) = Support (X \cup Y) = \cfrac{3}{5}Support(X)=Support(X∪Y)=

2 . 计算 S u p p o r t ( X ) \rm Support (X)Support(X) 支持度 , 项集 X = { 奶粉 } \rm X=\{ 奶粉 \}X={奶粉}

根据上述公式 S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=

count(D)

count(X)

计算支持度 ;

c o u n t ( X ) \rm count (X)count(X) 指的是数据集 D \rm DD 中含有项集 X \rm XX 的事务个数 ;

含有 X = { 奶粉 } \rm X=\{ 奶粉 \}X={奶粉} 项集的事务有事务 1 \rm 11 , 事务 3 33 , 事务 4 44 , 事务 5 55 , 得出 :

c o u n t ( X ) = 4 \rm count (X) = 4count(X)=4

c o u n t ( D ) \rm count(D)count(D) 指的是数据集 D \rm DD 的事务总数 ; 得出

c o u n t ( D ) = 5 \rm count(D) = 5count(D)=5

则计算支持度 :

S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)}Support(X)=

count(D)

count(X)

S u p p o r t ( X ) = 4 5 \rm Support (X) = \cfrac{4}{5}Support(X)=

3 . 求最终置信度

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)}confidence(X⇒Y)=

support(X)

support(X∪Y)

c o n f i d e n c e ( X ⇒ Y ) = 3 5 4 5 = 3 4 \rm confidence (X \Rightarrow Y) = \cfrac{ \dfrac{3}{5}}{\dfrac{4}{5}} = \cfrac{3}{4}confidence(X⇒Y)=

最终置信度为 3 4 \cfrac{3}{4}

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

热门文章

最新文章

相关课程

相关电子书