数据库——最小支持度&最小置信度

简介: 本篇文章主要讲述了数据库中最小支持度和最小置信度的问题,采用的是案例讲解法,没有公式,浅显易懂

案例分析


以下是某商场的购物记录集合,每个购物篮中包含若干商品。现在要基于该数据集进行关联规则挖掘,如果设置最小支持度为60%,最小置信度为80%,则在以下列出的关联规则中,符合条件的是(D)

购物篮编号 商品
1 A,B
2 A,B,C,D
3 A,C,D
4 B,C
5 B,C,D
  • A)A→B
  • B)B→C
  • C)C→B
  • D)D→C

最小支持度

  • 这种类型的题目通常采用的是逐个分析法,首先观察A选项,那么最小支持度就是A在5个购物篮编号中出现的频率,可以看到A在1,2,3号购物篮均出现了,因为总共有5哥购物篮,那么A选项A→B的最小支持度就是3/5,也就是60%
  • 其次观察B选项,B在5个篮子中的1,2,4,5都出现了,那么B选项B→C的最小支持度就是4/5,也就是80%
  • 同理可得C选项的最小支持度是80%,D选项的最小支持度是60%

最小置信度

  • 上述分析完了最小支持度,再来看最小置信度,首先是A选项,那么A选项的最小置信度就是B在A出现过的情况中出现过的频率,可以看到,B在1,2,4,5号购物篮中均出现过,但是A仅在1,2,3号购物篮中出现过,它们共同只出现在了1,2号购物篮,所以A选项A→B的最小置信度为2/3,也就是66.6%
  • 其次观察B选项B→C,B在5个篮子中的1,2,4,5都出现了,但是C只在2,3,4,5号购物篮中出现了,它们共同只出现在了2,4号购物篮,所以最小置信度为2/4,也就是50%
  • 同理可得C选项的最小置信度是100%,D选项的最小支持度是100%(超过80%满足条件)

综上所述:本题选择D选项


本文分以下四种情形来介绍。

目录
相关文章
|
1月前
|
SQL 关系型数据库 分布式数据库
在PolarDB中,行数评估是通过对表的统计数据、基数估计以及算子代价模型来进行估算的。
【2月更文挑战第14天】在PolarDB中,行数评估是通过对表的统计数据、基数估计以及算子代价模型来进行估算的。
84 1
|
4月前
|
资源调度 算法 数据挖掘
变异系数法:一种强大的数据离散度度量工具
变异系数法:一种强大的数据离散度度量工具
68 0
变异系数法:一种强大的数据离散度度量工具
|
11月前
|
物联网
以f结尾的频繁项集,置信度,支持度
以f结尾的频繁项集,置信度,支持度
给定一个数值,计算最合适的行列数量的代码
给定一个数值,计算最合适的行列数量的代码
71 0
|
数据库
LeetCode(数据库)- 给定数字的频率查询中位数
LeetCode(数据库)- 给定数字的频率查询中位数
105 0
LeetCode(数据库)- 给定数字的频率查询中位数
|
数据库
LeetCode(数据库)- 直线上的最近距离
LeetCode(数据库)- 直线上的最近距离
68 0
|
数据库
LeetCode(数据库)- 平面上的最近距离
LeetCode(数据库)- 平面上的最近距离
59 0
|
关系型数据库 MySQL
mysql查询最接近的值,查询最接近某一值的数据
mysql查询最接近的值,查询最接近某一值的数据
509 0
|
算法 C# 索引
C# 实现寻峰算法的简单优化(包含边峰,最小峰值,峰距)
原文:C# 实现寻峰算法的简单优化(包含边峰,最小峰值,峰距)   核心寻峰算法的原理参考Ronny,链接:投影曲线的波峰查找, C#翻译原理代码参考sowhat4999,链接:C#翻译Matlab中findpeaks方法  前人种树,后人乘凉。
1874 0