Recommender Systems基于内容的推荐-阿里云开发者社区

Recommender Systems基于内容的推荐

2015-05-19 922

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 　　基于内容的推荐的基本推荐思路是：用户喜欢幻想小说，这本书是幻想小说，则用户有可能喜欢这本小说　　两方面要求：（1）知道用户的喜好；（2）知道物品的属性　　基于内容的推荐相比协同过滤方法（个人观点）：协同过滤用到了大量用户的群体行为特征，两个特点，（1）要大量用户，（2）除了用户的行为之外，不需要其他信息；基于内容的推荐，需要用户和物品的额外信息，如：用户喜好、物品属性等等，但是不需要存储、处理大量的用户数据。

　　基于内容的推荐的基本推荐思路是：用户喜欢幻想小说，这本书是幻想小说，则用户有可能喜欢这本小说

　　两方面要求：（1）知道用户的喜好；（2）知道物品的属性

　　基于内容的推荐相比协同过滤方法（个人观点）：协同过滤用到了大量用户的群体行为特征，两个特点，（1）要大量用户，（2）除了用户的行为之外，不需要其他信息；基于内容的推荐，需要用户和物品的额外信息，如：用户喜好、物品属性等等，但是不需要存储、处理大量的用户数据。

　　基于内容的推荐和基于知识的推荐没有明确界限，两者区别：前者更侧重于提取物品属性，后者更侧重于因果关系。

　　基于内容的推荐一般应用在在文章、新闻推荐上面。文章的属性从文本内容中自动抽取。用户的喜好从用户从前评价过的文章中抽取。一般以关键词来表示文章和用户。

　　1. 内容表示和相似度

　　基于内容推荐的基本思路是：计算物品与用户喜欢的物品的相似度，从而确定用户是否喜欢该物品
　　如何获取用户的喜好？（1）明确的问用户；（2）请用户为一系列item进行打分，从而自动抽取特征
　　经典方法：用关键词来表示文本、tfidf表示关键词的权重、VSM模型来计算文本之间的相关度
　　问题：如何选取最有代表性的N个词语（特征选择）。
　　缺点：没法利用词语上下文信息

　　2. 基于内容相似度检索

　　协同过滤方法可以描述成为“推荐相似用户喜欢的物品”；基于内容的推荐方法可描述成为“推荐与用户过去喜欢的物品相似的物品”。这一节在上一节的基础上，讨论具体如何给用户推荐物品。

　　2.1 k近邻方法
　　对于某个用户未见的物品，找到用户从前评价过的k个与当前物品最相似的物品，根据用户对这k个物品的评分，来投票解决当前未知物品的评分。
　　Billsus2000，个性化移动新闻推荐：KNN用于对用户短期兴趣进行建模，用概率分类模型来对用户长期兴趣进行建模。长短两个模型共同作用，来给用户进行个性化新闻推荐。
　　如何组合长短兴趣模型？方法1：优先短期模型，然后长期模型；方法2，用短期模型把所有相关的item找到，然后用长期模型进行综合排序

　　2.2 相关性反馈 —— Rocchio方法
　　需要用户在使用过程中明确对item给出反馈，不实用。
　　在实际使用中可以考虑获取用户隐式反馈。
　　个性化搜索？如何把不同的相关度体系（pagerank和用户和物品相关度）融合在一起是个问题。

　　3 其他文本分类方法

　　将推荐问题转成分类问题，用分类器来做推荐，例如：朴素贝叶斯+二分类，来预测用户是否喜欢某个特定商品
　　还有svm、决策树等模型。涉及到特征选择，用卡方选择或者fisher判别。

　　4. 小结

　　基于内容的推荐技术，大多数方法都源于信息检索领域。

　　参考文献http://blog.csdn.net/xceman1997/article/details/41791651

Recommender Systems基于内容的推荐

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Recommender Systems基于内容的推荐

热门文章

最新文章

相关课程

相关电子书