开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

R语言数据挖掘2.1.2.1 关联规则

简介:
+关注继续查看

2.1.2.1 关联规则


关联分析可以从海量数据集中发现有意义的关系,这种关系可以表示成关联规则的形式或频繁项集的形式。具体的关联分析算法将在后面一个章节中给出。

关联规则挖掘旨在发现给定数据集(事务数据集或其他序列-模式-类型数据集)中的结果规则集合。给定预先定义的最小支持度计数s和置信度c,给定已发现的规则X→Y support_count (X→Y)≥s且confidence (X→Y)≥c。

当X∩Y=(X、Y不相交),则X→Y是关联规则。规则的兴趣度通过支持度(support)和置信度(confidence)来测量。支持度表示数据集中规则出现的频率,而置信度测量在X出现的前提下,Y出现的可能性。

对于关联规则,衡量规则可用性的核心度量是规则的支持度和置信度。两者之间的关系是:

 

support_count(X)是数据集中包含X的项集数。

通常,在support_count(X)中,支持度和置信度的值表示为0~100的百分数。

给定最小支持度阈值s和最小置信度阈值c。如果support_count (X→Y) > s且confidence (X→Y)≥c,则关联规则X→Y称为强规则。

对于关联规则含义的解释应当慎重,尤其是当不能确定地判断规则是否意味着因果关系时。它只说明规则的前件和后件同时发生。以下是可能遇到不同种类的规则:

布尔关联规则:若规则包含项出现的关联关系,则称为布尔关联规则。

单维关联规则:若规则最多包含一个维度,则为单维关联规则。

多维关联规则:若规则至少涉及两个维度,则为多维关联规则。

相关关联规则:若关系或规则是通过统计相关进行测量的,满足给定的相关性规则,则称为相关关联规则。

定量关联规则:若规则中至少一个项或属性是定量的,则称为定量关联规则。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《数据挖掘:实用案例分析》——2.3 关联规则
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第2章,第2.3节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2155 0
《R语言数据挖掘》——导读
Preface 前  言 世界各地的统计学家和分析师正面临着处理许多复杂统计分析项目的迫切问题。由于人们对数据分析领域的兴趣日益增加,所以R语言提供了一个免费且开源的环境,非常适合学习和有效地利用现实世界中的预测建模方案。
2121 0
数据挖掘算法之关联规则挖掘(一)apriori算法
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/45230011 关...
951 0
10057
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载