开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

《R语言数据挖掘》——2.5 R语言实现

简介:
+关注继续查看

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.5 R语言实现

算法主要部分的R语言实现为:

QQ_20170524175437
QQ_20170524175440

2.5.1 SPADE算法

使用等价类的序列模式发现(Sequential Pattern Discovery using Equivalent class,SPADE)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是:

SPADE算法是Apriori算法的扩展。

算法采用Apriori性质。

需要对初始事务数据集进行多次扫描。

采用垂直数据格式。

算法采用简单的连接运算。

所有序列的发现都需要对数据进行3次扫描。

下面是调用SPADE算法之前的伪代码
F←, ∧k←0, P←{∈∑, support_count(s)≥MIN_SUP}
QQ_20170524175445
QQ_20170524175451

R语言实现

算法主要部分的R语言代码实现是:
QQ_20170524175454

2.5.2 从序列模式中生成规则

序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《数据科学:R语言实现》——导读
大数据、物联网、人工智能已经变成近几年最热门的科技流行语。尽管大家用很多名词去定义这些技术,但是共通的思想是它们都是数据驱动的。人们并不满足于简单地拥有数据,因为发现其中的价值才是最本质的。因此数据科学家已经开始关注如何从原始数据中洞悉深层价值。
1728 0
10057
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载