【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )

简介: 【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )

文章目录

一、 频繁项集

二、 非频繁项集

三、 强关联规则

四、 弱关联规则

五、 发现关联规则

参考博客 :


【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )





一、 频繁项集


项集 X \rm XX 的 支持度 s u p p o r t ( X ) \rm support(X)support(X) , 大于等于 指定的 最小支持度阈值 m i n s u p \rm minsupminsup ,


则称该 项集 X \rm XX 为 频繁项集 ,


又称为 频繁项目集 ;






二、 非频繁项集


项集 X \rm XX 的 支持度 s u p p o r t ( X ) \rm support(X)support(X) , 小于 指定的 最小支持度阈值 m i n s u p \rm minsupminsup ,


则称该 项集 X \rm XX 为 非频繁项集 ,


又称为 非频繁项目集 ;






三、 强关联规则


项集 X \rm XX 是 频繁项集 的前提下 , ( 项集 X \rm XX 的 支持度 s u p p o r t ( X ) \rm support(X)support(X) , 大于等于 指定的 最小支持度阈值 m i n s u p \rm minsupminsup ) ,


置信度 c o n f i d e n c e ( X ⇒ Y ) \rm confidence (X \Rightarrow Y)confidence(X⇒Y) 大于等于 置信度最小阈值 m i n c o n f \rm minconfminconf ,


称该 关联规则 X ⇒ Y X \Rightarrow YX⇒Y 是 强关联规则 ;






四、 弱关联规则


项集 X \rm XX 是 频繁项集 的前提下 , ( 项集 X \rm XX 的 支持度 s u p p o r t ( X ) \rm support(X)support(X) , 小于等于 指定的 最小支持度阈值 m i n s u p \rm minsupminsup ) ,


置信度 c o n f i d e n c e ( X ⇒ Y ) \rm confidence (X \Rightarrow Y)confidence(X⇒Y) 小于 置信度最小阈值 m i n c o n f \rm minconfminconf ,


称该 关联规则 X ⇒ Y X \Rightarrow YX⇒Y 是 弱关联规则 ;






五、 发现关联规则


发现关联规则 :


从 数据集 D \rm DD 中 , 发现 支持度 s u p p o r t \rm supportsupport , 置信度 c o n f i d e n c e \rm confidenceconfidence , 大于等于给定 最小阈值 的 强关联规则 ;


目的是 发现 强关联规则 ;


目录
相关文章
|
4月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题
金山办公2020校招大数据和机器学习算法笔试题的解析,涵盖了编程、数据结构、正则表达式、机器学习等多个领域的题目和答案。
105 10
|
4月前
|
算法 数据挖掘 Python
【数据挖掘】十大算法之Apriori关联算法
Apriori关联算法,这是一种用于发现数据集中频繁项集和关联规则的数据挖掘技术,通过迭代过程找出满足最小支持度阈值的项集。
71 8
|
4月前
|
自然语言处理 算法 数据挖掘
【数据挖掘】十大算法之PageRank连接分析算法
文章介绍了PageRank算法的基本概念和数学模型,包括如何通过一阶马尔科夫链定义随机游走模型以及如何计算网页的重要性评分,并提供了PageRank迭代算法的具体步骤。
79 0
|
3月前
|
算法 前端开发 机器人
一文了解分而治之和动态规则算法在前端中的应用
该文章详细介绍了分而治之策略和动态规划算法在前端开发中的应用,并通过具体的例子和LeetCode题目解析来说明这两种算法的特点及使用场景。
一文了解分而治之和动态规则算法在前端中的应用
|
3月前
|
机器学习/深度学习 数据采集 算法
数据挖掘和机器学习算法
数据挖掘和机器学习算法
|
4月前
|
机器学习/深度学习 存储 人工智能
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
本文是关于2022-2023年知能科技公司机器学习算法工程师岗位的秋招笔试题,包括简答题和编程题,简答题涉及神经网络防止过拟合的方法、ReLU激活函数的使用原因以及条件概率计算,编程题包括路径行走时间计算和两车相向而行相遇时间问题。
77 2
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
|
4月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】2020奇安信秋招算法方向试卷1 笔试题解析
2020年奇安信秋招算法方向试卷1的题目解析,覆盖了数据结构、机器学习、深度学习、自然语言处理、排序算法、激活函数、主题模型、采样方法、图像处理等多个领域的知识点。
51 1
【数据挖掘】2020奇安信秋招算法方向试卷1 笔试题解析
|
4月前
|
机器学习/深度学习 存储 算法
【数据挖掘】2020奇安信秋招算法方向试卷3 笔试题解析
2020年奇安信秋招算法方向试卷3的题目解析,涵盖了数据结构、机器学习、深度学习、自然语言处理、排序算法、激活函数、PCA、词嵌入库等多个领域的知识点。
63 1
【数据挖掘】2020奇安信秋招算法方向试卷3 笔试题解析
|
4月前
|
机器学习/深度学习 人工智能 算法
【数据挖掘】2022年2023届秋招奇虎360机器学习算法工程师 笔试题
本文提供了奇虎360公司2022年秋招机器学习算法工程师岗位的笔试题内容,包括选择题和编程题,涉及概率统计、数据结构、机器学习、计算机组成原理等多个领域。
98 5
|
4月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】2022年2023届秋招宏瓴科技公司机器学习算法工程师 笔试题
关于宏瓴科技有限公司2022-2023年秋招机器学习算法工程师岗位的笔试题目及作者个人对部分题目的解答尝试,涉及贝叶斯误差和贝叶斯最优分类器的概念、贝叶斯误差的重要性和估算方法,以及如何有效利用训练集和测试集进行深度学习模型训练的数据集划分策略。
61 4

热门文章

最新文章

下一篇
无影云桌面