计算支持度,置信度
{a}的支持度为8/10 (出现的次数/所有的记录) |
{b}的支持度为7/10 |
{a—>b}的置信度为 5/8 ( ab一起出现的次数/a出现的次数) |
求频繁项集
TID |
Items Bought | (Ordered) Frequent Items |
100 |
f,a,c,d,g,i,m,p |
f,c,a,m,p |
200 |
a,b,c,f,l,m,o |
f,c,a,b,m |
300 |
b,f,h,j,o |
f,b |
400 |
b,c,k,s,p | c,b,p |
500 |
a,f,c,e,l,p,m,n |
f,c,a,m,p |
选出出现次数>=3的
以a结尾的有频繁项集有{(fa:3),(fca:3),(ca:3),(a:3)}
以f结尾的有频繁项集有{(f:4)}
以b结尾的有频繁项集有{(b:3)}
以m结尾的有频繁项集有{(m:3))}
以c结尾的有频繁项集有{(fc:3),(c:4)}
以(a,m)结尾的有频繁项集有{(am:3),(cam:3)(fam:3),(fcam:3)}
以(c,m)结尾的有频繁项集有{(cm:3),(fcm:3)}
以(f,m)结尾的有频繁项集有{(fm:3)}