《R语言数据挖掘》——2.3 混合关联规则挖掘

简介:

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.3节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 混合关联规则挖掘

关联规则挖掘有两个有意义的应用:一是多层次和多维度关联规则挖掘;二是基于约束的关联规则挖掘。

2.3.1 多层次和多维度关联规则挖掘

对于给定的事务数据集,若数据集的某些维度存在概念层次关系,则需要对该数据集进行多层次关联规则挖掘。对事物数据集可用的任何关联规则挖掘算法都可以用于该任务。下表给出亚马逊商店的一个例子。
QQ_20170524173851

下面是多层次模式挖掘的流程图。
QQ_20170524173854

基于概念层次,低层次概念可以投影到高层次概念,具有高层次概念的新数据集可以代替原始的低层次概念。

可以在每个概念层次计算支持计数。许多类Apriori算法在计算支持计数时稍微有些不同。下面是几种不同的方法:

对所有的层次使用统一的最小支持度阈值。

对较低的层次使用较小的支持度阈值。

基于组的最小支持度阈值。

有时,Apriori性质并不总成立。这里有一些例外。

多层次关联规则是从概念层次的多层次中挖掘出来的。

2.3.2 基于约束的频繁模式挖掘

基于约束的频繁模式挖掘是使用用户设定的约束对搜索空间进行剪枝的启发式算法。

常见的约束有(但不局限于)以下几种情况:

知识类型的约束(指定我们想要挖掘什么)

数据约束(对初始数据集的限制)

维度层次约束

兴趣度约束

规则约束

相关文章
|
6月前
|
人工智能 算法 数据挖掘
数据挖掘(3.1)--频繁项集挖掘方法
关联规则挖掘是数据挖掘领域中研究最为广泛的也最为活跃的方法之一 关联规则反应了一个事物和其他事物之间的相互依存性和关联性 如果存在一定的关联关系,其中一个事物就可以通过其他事物预测到 最小支持度:就是说当支持度达到一定的阈值后,某种数据才有被挖掘的潜力这个阈值就是最小支持度计数(min_sup)。
75 0
|
4月前
|
算法 数据挖掘 数据库
【数据挖掘】频繁项集挖掘方法中Apriori、FP-Growth算法详解(图文解释 超详细)
【数据挖掘】频繁项集挖掘方法中Apriori、FP-Growth算法详解(图文解释 超详细)
138 0
|
4月前
|
算法 数据挖掘 数据库
【数据挖掘】关联规则、频繁项集、闭项集详解(图文解释 超详细)
【数据挖掘】关联规则、频繁项集、闭项集详解(图文解释 超详细)
258 1
|
5月前
|
存储 算法 数据挖掘
数据挖掘2.4——关联规则挖掘 知识点整理
数据挖掘2.4——关联规则挖掘 知识点整理
120 0
|
9月前
|
机器学习/深度学习 人工智能 算法
数据挖掘18大算法实现以及其他相关经典DM算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等
数据挖掘18大算法实现以及其他相关经典DM算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等
|
10月前
|
算法 数据挖掘 Python
数据挖掘与关联规则:发现隐藏在数据中的模式
数据挖掘是从大规模数据集中发现有价值的信息和模式的过程。其中,关联规则是一种常用的数据挖掘技术,它可以帮助我们发现数据中的相关性和潜在规律。在本文中,我们将介绍关联规则的概念、算法以及如何使用Python实现关联规则的挖掘。
180 0
|
12月前
|
数据采集 算法 数据挖掘
【数据挖掘实战】——中医证型的关联规则挖掘(Apriori算法)
项目地址:Datamining_project: 数据挖掘实战项目代码
479 0
|
存储 算法 数据挖掘
数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法
数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法
131 0
|
数据可视化 数据挖掘 数据库
【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【动态可视化工具】
推荐一个在线制作动图网站 Flourish(https://app.flourish.studio) 无需编程基础就可以做出漂亮的动态图表🎉🎉🎉
187 1
【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【动态可视化工具】
|
算法 数据挖掘
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
151 0