1.推荐系统:
推荐系统的目的就是为了让用户更快更好的获取到自己需要的内容。
推荐算法应用场景:
应用场景.png
推荐系统基本思想:
- 利用用户和物品的特征信息,给用户推荐那些具有用户喜欢的特征的物品。
- 利用用户喜欢过的物品,给用户推荐与他喜欢过物品的相似物品。
- 利用和用户相似的其他用户,给用户推荐那些和他们兴趣爱好相似的其他用户喜欢的物品。
推荐系统数据分析:
- 要推荐物品或者内容的元数据,例如:关键字、分类标签、基因描述等
- 系统用户的基本信息,例如:性别、年龄、兴趣标签等
用户的行为数据,可以专转化为对物品或者信息的偏好,根据应用本身的不同,可能包括用户对物品的评分,用户查看物品的记录,用户的购买记录等。这些用户偏好信息可以被分为两类:
- 显式的用户反馈:这类是用户在网站上自然浏览或者使用网站以外,显示提供反馈信息,例如用户对商品进行评分,或者对物品进行评论等。
- 隐式的用户反馈:这类是用户在使用网站过程中产生的数据,隐式的反应了用户对物品的喜好,例如用户购买了某物品,用户查看了某物品信息等等。
Snipaste_2024-01-14_17-10-55.png
2.推荐算法综述:
基于人口统计学推荐算法:
基于内容的推荐算法:
基于协同过滤的推荐算法:
协同过滤(Collaborative Filtering,CF)
基于近邻的协同过滤:基于用户(User-CF)、基于物品(Item-CF)
基于模型的协同过滤:奇异值分解(SVD)、潜在语义分析(LSA)、支撑向量机(SVM)
基于内容(Content Base,CB)主要利用的是用户评价过的物品的内容特征,而CF方法还可以利用其他用户评分过的物品内容。
CF 可以解决一些 CB 的局限:
- 物品内容不完全或者难以获得时,依然可以通过其他用户反馈给出推荐。
- CF基于用户之间对物品的评价质量,避免了CB仅依赖内容可能造成的对物品质量判断的干扰。
- CF推荐不受内容限制,只要其他类似用户给出了对不同物品的兴趣,CF就可以给用户推荐出内容差异很大的物品(但有某种内在联系)
基于用户的协同过滤
基于物品的协同过滤
- 混合推荐算法:
实际网站的推荐系统往往都不会采用单一的推荐机制和策略,一般使用多个方法混合在一起,从而实现更好的推荐效果。
加权混合:用线性公式(liner formula)将几种不同的推荐按照一定的权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果。
切换混合:切换的混合方式,就是在允许不同情况(数据量、系统运行状态、用户和物品数量等)选择最合适的推荐机制计算推荐。
分区混合:采用多种推荐机制,并将不同的推荐结果分为不同的区显示给用户。
分层混合:采用多种推荐机制,并将一个推荐机制的结果作为另外一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。