【推荐系统】推荐系统中分解共现矩阵的优点与局限性

简介: 由于使用协同过滤,单纯考虑user或item之间的正反馈交互以及相似度量,这不能很好的利用全局信息,如果两个用户没有相同的历史行为,或者两个物品没有相同的用户购买,那么对于这两个物品或者用户来说,它们之间的相似度为0,这就会导致使用协同过滤不具备泛化利用全局信息的能力。

由于使用协同过滤,单纯考虑user或item之间的正反馈交互以及相似度量,这不能很好的利用全局信息,如果两个用户没有相同的历史行为,或者两个物品没有相同的用户购买,那么对于这两个物品或者用户来说,它们之间的相似度为0,这就会导致使用协同过滤不具备泛化利用全局信息的能力。


而隐向量的生成过程其实是对共享矩阵进行全局拟合的过程,因此隐向量其实是利用全局信息生成的。


矩阵分解的优点:


  • 泛化能力强:在一定程度上解决了矩阵稀疏的问题
  • 空间复杂度低:使用协同过滤进行推荐,需要维护用户和物品的相似度矩阵,而使用隐向量只需要存储物品和用户的隐向量矩阵即可,这就使得空间复杂度从
    网络异常,图片无法展示
    |
    降低到
    网络异常,图片无法展示
    |
  • 更好的扩展性和灵活性:矩阵分解的最终产出是用户和物品的隐向量矩阵,这其实与深度学习中的Embedding思想不谋而合,因此矩阵分解的结果也非常便于与其它特征进行组合和拼接,并便于与深度学习网络进行无缝结合


局限性:


  • 矩阵分解只能够使用共现矩阵,不能将用户、物品和上下文特征考虑在内进行建模,这将丧失很多信息
目录
相关文章
|
7月前
|
机器学习/深度学习 算法
大模型开发:解释随机森林算法以及它是如何做出决策的。
随机森林是集成学习方法,利用多棵决策树提升性能。通过随机抽样和特征选择创建弱分类器,减少模型相关性。每个决策树基于子数据集和特征子集构建,预测时集成所有决策树结果,分类问题采用投票,回归问题取平均值。这种方法降低过拟合风险,提高准确性和稳定性,对噪声和异常值容忍度高,广泛应用。
100 0
|
7月前
|
机器学习/深度学习 自然语言处理 Python
传统的序列模型CRF实现和优劣势
传统的序列模型CRF实现和优劣势
|
4月前
|
UED
评估数据集CGoDial问题之主流生成伪OOD样本的问题如何解决
评估数据集CGoDial问题之主流生成伪OOD样本的问题如何解决
|
7月前
|
机器学习/深度学习 人工智能 测试技术
【机器学习】R-squared系数有什么缺点?如何解决?
【5月更文挑战第20天】【机器学习】R-squared系数有什么缺点?如何解决?
|
7月前
|
数据可视化
R语言实现有限混合模型建模分析
R语言实现有限混合模型建模分析
|
7月前
R语言 线性混合效应模型实战案例
R语言 线性混合效应模型实战案例
|
机器学习/深度学习
总结机器学习中7种离散特征编码方式优缺点
整理总结对比了7种机器学习离散特征编码方式的优缺点
237 0
|
机器学习/深度学习 人工智能 算法
一文搞懂模型量化算法基础
一文搞懂模型量化算法基础
4092 0
|
算法 搜索推荐
推荐算法的优点
推荐算法的优点
133 0
算法训练Day24|理论基础 ● 77. 组合
算法训练Day24|理论基础 ● 77. 组合