开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

《R语言数据挖掘》——2.3 混合关联规则挖掘

简介:
+关注继续查看

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.3节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 混合关联规则挖掘

关联规则挖掘有两个有意义的应用:一是多层次和多维度关联规则挖掘;二是基于约束的关联规则挖掘。

2.3.1 多层次和多维度关联规则挖掘

对于给定的事务数据集,若数据集的某些维度存在概念层次关系,则需要对该数据集进行多层次关联规则挖掘。对事物数据集可用的任何关联规则挖掘算法都可以用于该任务。下表给出亚马逊商店的一个例子。
QQ_20170524173851

下面是多层次模式挖掘的流程图。
QQ_20170524173854

基于概念层次,低层次概念可以投影到高层次概念,具有高层次概念的新数据集可以代替原始的低层次概念。

可以在每个概念层次计算支持计数。许多类Apriori算法在计算支持计数时稍微有些不同。下面是几种不同的方法:

对所有的层次使用统一的最小支持度阈值。

对较低的层次使用较小的支持度阈值。

基于组的最小支持度阈值。

有时,Apriori性质并不总成立。这里有一些例外。

多层次关联规则是从概念层次的多层次中挖掘出来的。

2.3.2 基于约束的频繁模式挖掘

基于约束的频繁模式挖掘是使用用户设定的约束对搜索空间进行剪枝的启发式算法。

常见的约束有(但不局限于)以下几种情况:

知识类型的约束(指定我们想要挖掘什么)

数据约束(对初始数据集的限制)

维度层次约束

兴趣度约束

规则约束

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《大数据分析原理与实践》一一 3.2 关联规则分析
本节书摘来自华章出版社《大数据分析原理与实践》一 书中的第3章,第3.2节,作者:王宏志 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1157 0
《数据挖掘:实用案例分析》——2.3 关联规则
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第2章,第2.3节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2130 0
《R语言数据挖掘》——导读
Preface 前  言 世界各地的统计学家和分析师正面临着处理许多复杂统计分析项目的迫切问题。由于人们对数据分析领域的兴趣日益增加,所以R语言提供了一个免费且开源的环境,非常适合学习和有效地利用现实世界中的预测建模方案。
2103 0
10057
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载