备案控制台

开发者社区人工智能文章正文

基于受限玻尔兹曼机(RBM)的协同过滤

2017-09-24 3291

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

受限玻尔兹曼机是一种生成式随机神经网络(generative stochastic neural network), 详细介绍可见我的博文《受限玻尔兹曼机(RBM)简介》, 本文主要介绍RBM在协同过滤的应用。

1. 受限玻尔兹曼机简单介绍

传统的受限玻尔兹曼机是一种如下图所示, 其由一些可见单元(visible unit，对应可见变量，亦即数据样本)和一些隐藏单元(hidden unit，对应隐藏变量)构成，可见变量和隐藏变量都是二元变量，亦即其状态取{0,1}。整个网络是一个二部图，只有可见单元和隐藏单元之间才会存在边，可见单元之间以及隐藏单元之间都不会有边连接。

将该模型应用到协同过滤需要解决以下两个问题:

鉴于RBM中的单元都是二元变量, 如果用这些二元变量来对整数值的评分建模?
用户的打分是非常稀疏的, 亦即用户只会对很少的物品(比如电影)打分, 如何处理这些缺失的评分?

2. 基于RBM的协同过滤

R. R. Salakhutdinov等人提出了一种使用RBM来进行协同过滤的方法:

假设有m个电影, 则使用m个softmax单元来作为可见单元来构造RBM. 对于每个用户使用不同的RBM, 这些不同的RBM仅仅是可见单元不同, 因为不同的用户会对不同的电影打分, 所有的这些RBM的可见单元共用相同的偏置以及和隐藏单元的连接权重W. 该方法很好的解决了之前提到的问题:

使用softmax来对用户的评分进行建模, softmax是一种组合可见单元, 包含k个二元单元, 第i个二元单元当且只当用户对该电影打分为i时才会置为1.
如果一个用户没有对第j个电影评分, 则该用户的RBM中不存在第j个softmax单元.

该模型如下图所示:

可是单元V和隐藏单元h的条件概率为:

模型参数的学习过程非常类似于RBM的DC算法:

训练完模型后, 计算用户对未评价物品的预测评分的算法为:

3. 条件RBM(Conditional Restricted Boltzmann Machine)

以上的RBM只用到了用户对电影的评分, 忽视了另外一种非常重要的信息: 用户浏览过哪些电影(但是没打分, 或者打分未知), 条件RBM把这种信息也进行了建模:

其中的r是一个m维的向量, r_i为1代表用户对浏览过第i个电影, 加入r后的模型的条件概率为:

权重D的学习过程为:

参考文献:

[1]. Ruslan Salakhutdinov, Andriy Mnih, Geoffrey Hinton. Restricted Boltzmann Machines for Collaborative Filtering. 2007, ICML.

[2]. Gilles Louppe, Pierre Geurts. Collaborative filtering: Scalable approaches using restricted Boltzmann machines.

[3]. 受限玻尔兹曼机(RBM)简介

文章标签：

算法

搜索推荐

yabmarlboro

目录

相关文章

我爱matlab

|

机器学习/深度学习数据采集算法

m基于GA-LSTM遗传优化长短期记忆网络的电力负荷数据预测算法matlab仿真

m基于GA-LSTM遗传优化长短期记忆网络的电力负荷数据预测算法matlab仿真

我爱matlab

188 4 4

陌陌谣

|

机器学习/深度学习数据采集算法

序列模型算法在上网行为管理中的应用：精度提升的新途径

当我们谈论如何通过序列模型算法来提升上网行为管理的精度时，其实是一种超级有用的工具，可以帮助我们更轻松地识别和管理用户的行为，让网络管理员更加高效地监管网络活动。下面是一些有趣的方法，可以通过序列模型算法来提高上网行为管理的准确性——

陌陌谣

194 1 1

酷酷的群

|

机器学习/深度学习

受限玻尔兹曼机|机器学习推导系列（二十五）

受限玻尔兹曼机|机器学习推导系列（二十五）

酷酷的群

819 0 0

受限玻尔兹曼机|机器学习推导系列（二十五）

Deephub

|

数据可视化搜索推荐 PyTorch

使用卷积操作实现因子分解机

本文将介绍如何使用卷积操作实现因子分解机器。卷积网络因其局部性和权值共享的归纳偏差而在计算机视觉领域获得了广泛的成功和应用。卷积网络可以用来捕获形状的堆叠分类特征(B, num_cat, embedding_size)和形状的堆叠特征(B, num_features, embedding_size)之间的特征交互。

Deephub

151 1 1

Matlab科研工作室

|

机器学习/深度学习传感器算法

【通信优化】基于粒子群优化行为控制实现无人机多跳 Ad-hoc 网络优化部署附matlab代码和复现论文

【通信优化】基于粒子群优化行为控制实现无人机多跳 Ad-hoc 网络优化部署附matlab代码和复现论文

Matlab科研工作室

171 0 0

小小何先生

|

人工智能算法

机器博弈 (三) 虚拟遗憾最小化算法

机器博弈 (三) 虚拟遗憾最小化算法

小小何先生

316 0 0

我爱matlab

|

机器学习/深度学习算法数据库

受限波尔茨曼机RBM_DBN深度学习网络训练和测试matlab仿真,数据库为随机数矩阵

受限波尔茨曼机RBM_DBN深度学习网络训练和测试matlab仿真,数据库为随机数矩阵

我爱matlab

236 4 4

受限波尔茨曼机RBM_DBN深度学习网络训练和测试matlab仿真,数据库为随机数矩阵

-开发达人-

|

机器学习/深度学习存储网络架构

比量子化学方法快六个数量级，一种基于绝热状态的绝热人工神经网络方法，可加速对偶氮苯衍生物及此类分子的模拟

比量子化学方法快六个数量级，一种基于绝热状态的绝热人工神经网络方法，可加速对偶氮苯衍生物及此类分子的模拟

-开发达人-

154 0 0

MrRobot

|

机器学习/深度学习数据采集自然语言处理

使用向量机（SVM）算法的推荐系统部署实现

使用向量机（SVM）算法的推荐系统部署实现

MrRobot

238 0 0

Chainlink

|

存储设计模式 Oracle

Chainlink预言机基本原理

本文从预言机的概念开始，通过一个简单的获取 ETH 价格的例子，讲解了请求/响应模式的 Chainlink 预言机的基本过程，希望对你理解预言机与 Chainlink 的运行原理有所帮助。

Chainlink

1920 0 0

热门文章

最新文章

攻防实战：教你轻松查看QQ空间加密后的好友图片

canceling statement due to conflict with recovery

一文搞懂App测试，APP测试方案

vc 6.0的安装问题

python re正则表达式基本使用介绍

SQL Server-聚焦过滤索引提高查询性能

《Linux From Scratch》第三部分：构建LFS系统第六章：安装基本的系统软件- 6.8. Man-pages-3.79

IP标准化推动物联网发展

数据加载的性能测试

一款轻量级的PHP链接发布页面源码

uv安装python及其依赖的加速方法

用 SQL 还是 NoSQL？Apipost 的回答是：两个都要！

使用 Node.js、Express 和 React 构建强大的 API

云产品评测｜从数据治理到智能分析，一站式构建企业数据中台的实战体验

TVM虚拟机应用实例

《分布式软总线：解锁未来柔性电子设备互联新境界》

《揭秘分布式软总线开发框架：解锁快速迭代与功能扩展的密码》

《深度剖析：分布式软总线双轮驱动机制下传输效率与可靠性的精妙平衡》

相关电子书

更多

改善弱网络-探索移动互联网下弱网络处理方式

低代码开发师（初级）实战教程

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云无影云电脑免费试用，最长可试用3个月