案例分析
以下是某商场的购物记录集合,每个购物篮中包含若干商品。现在要基于该数据集进行关联规则挖掘,如果设置最小支持度为60%,最小置信度为80%,则在以下列出的关联规则中,符合条件的是(D)
购物篮编号 | 商品 |
1 | A,B |
2 | A,B,C,D |
3 | A,C,D |
4 | B,C |
5 | B,C,D |
- A)A→B
- B)B→C
- C)C→B
- D)D→C
最小支持度
- 这种类型的题目通常采用的是逐个分析法,首先观察A选项,那么最小支持度就是A在5个购物篮编号中出现的频率,可以看到A在1,2,3号购物篮均出现了,因为总共有5哥购物篮,那么A选项A→B的最小支持度就是3/5,也就是60%
- 其次观察B选项,B在5个篮子中的1,2,4,5都出现了,那么B选项B→C的最小支持度就是4/5,也就是80%
- 同理可得C选项的最小支持度是80%,D选项的最小支持度是60%
最小置信度
- 上述分析完了最小支持度,再来看最小置信度,首先是A选项,那么A选项的最小置信度就是B在A出现过的情况中出现过的频率,可以看到,B在1,2,4,5号购物篮中均出现过,但是A仅在1,2,3号购物篮中出现过,它们共同只出现在了1,2号购物篮,所以A选项A→B的最小置信度为2/3,也就是66.6%
- 其次观察B选项B→C,B在5个篮子中的1,2,4,5都出现了,但是C只在2,3,4,5号购物篮中出现了,它们共同只出现在了2,4号购物篮,所以最小置信度为2/4,也就是50%
- 同理可得C选项的最小置信度是100%,D选项的最小支持度是100%(超过80%满足条件)
综上所述:本题选择D选项
本文分以下四种情形来介绍。