resource recommendation| 学习笔记

简介: 快速学习 resource recommendation。

开发者学堂课程【高校精品课-北京理工大学-数据仓库与数据挖掘(上):resource recommendation】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/921/detail/15625


resource recommendation

 

内容介绍

一、知识的评估

二、新颖性

三、数据挖掘领域的会议和论文

 

一、知识的评估

在讲数据挖掘概念的时候,我们说过知识必须要经过评估,评估为有效的知识,才是我们最后要得到的知识。

但是数据挖掘是针对不同的任务的。我们需要针对不同的数据挖掘任务去制定我们的知识评估方案。

比如在关联规则挖掘中。强关联规则必须具有较高的支持度和置信度。但是具有较高支持度和置信度的规则并不一定是有效的关联规则。我们可能还要涉及类似于提升度这个指标去评估这个关联规则的有效性。在我们这个课件上列出了覆盖率,新颖性,准确性和时效性。

image.png 

这4个指标主要是用于在推荐系统中对推荐效果进行评估。用于横连我们的推荐模型或者是推荐算法是否有效。

 

二、新颖性

比如说我们在向用户进行推荐的时候,我们往往是根据用户已有的购买记录,或者是和他相似的用户的购买记录,向用户进行推荐。但是如果我们向用户推荐的一个谁都没有买过的产品,而且这个产品正是用户想购买的。

那么就说明这个推荐是很新颖的。它的新颖性就是非常好的。因此我们在面向不同的数据挖掘任务的时候,我们要仔细地去制定对知识的评估的一些方法和指标。

 

三、数据挖掘领域的会议和论文。

在数据挖掘领域比较知名的会议,包含 KDD  ,  SDM  ,  ICDM 等。和它相关的一些会议包含 SIGMOD  , VLDB 等等。那么大家可以通过阅览这些会议上的信息,去跟踪数据挖掘的一些最新研究进展。此外在数据挖掘领域比较权威的期刊,包括 TKDE , DMKD ,以及   DAMI 等杂志。

那么在这些杂志上,大家也可以去看到一些非常质量非常高的论文,发现一些比较好的数据挖掘算法。

以上就是向大家推荐的一些数据挖掘方面的一些学习资料,希望大家在数据挖掘的学习过程中能够使用到。

相关文章
|
2月前
|
JSON API 数据格式
RAM(Risk Assessment Manager)
RAM(Risk Assessment Manager)是阿里云提供的一种风险评估服务,用于帮助用户识别和解决安全问题。在阿里云容器服务ACK中,RAM用户可以被授权访问特定的集群,以便进行只读操作。
59 2
|
12月前
|
设计模式 缓存 监控
译|Design patterns for container-based distributed systems(下)
译|Design patterns for container-based distributed systems(下)
47 0
|
12月前
|
设计模式 分布式计算 Kubernetes
译|Design patterns for container-based distributed systems(上)
译|Design patterns for container-based distributed systems
55 0
PAT (Advanced Level) Practice - 1107 Social Clusters(30 分)
PAT (Advanced Level) Practice - 1107 Social Clusters(30 分)
125 0
|
存储 负载均衡 算法
Morsel-Driven Parallelism: A NUMA-Aware Query Evaluation Framework for the Many-Core Age 论文解读
这篇paper介绍了TUM的内存数据库系统HyPer中使用的,基于小块数据(morsel)来驱动的并行查询执行框架。用来解决many-cores(NUMA)环境下,分析型查询的scalability问题。
1269 0
Morsel-Driven Parallelism: A NUMA-Aware Query Evaluation Framework for the Many-Core Age 论文解读
|
安全 Go
Improving your Organizations Data Governance Scorecard
This whitepaper looks at how businesses can improve their scores on the tests of three fundamental data governance areas.
1324 0