fast.ai 深度学习笔记:第一部分第五课

简介: 原文:Deep Learning 2: Part 1 Lesson 5作者:Hiromi Suenaga课程论坛一,引言没有足够的关于结构化深度学习的出版物,但它肯定出现在行业中:结构化深度学习,作者:Kerem Turgutlu @datascience.

原文:Deep Learning 2: Part 1 Lesson 5

作者:Hiromi Suenaga

一,引言

没有足够的关于结构化深度学习的出版物,但它肯定出现在行业中:

结构化深度学习,作者:Kerem Turgutlu @datascience.com

你可以使用此工具从 Google 下载图片并解决自己的问题:

小型图像数据集的乐趣(第2部分),作者:Nikhil B @datascience.com

如何训练神经网络的介绍(一篇伟大的技术写作):

我们如何“训练”神经网络?,由 Vitaly Bushaev @datascience.com

学生们在 Kaggle 幼苗分类比赛中与 Jeremy 竞争。

II. 协同过滤 - 使用 MovieLens 数据集

讨论的笔记本可以在这里找到(lesson5-movielens.ipynb)。

我们来看看数据。 我们将使用userId (类别), movieId (类别)和rating(因变量)进行建模。

ratings = pd.read_csv(path+'ratings.csv')
ratings.head() 

image.png

为 Excel 创建子集

我们创建了最受欢迎的电影和大多数电影狂热粉的交叉表,我们将其复制到 Excel 中进行可视化。

g=ratings.groupby('userId')['rating'].count()  
topUsers=g.sort_values(ascending=False)[:15] 

g=ratings.groupby('movieId')['rating'].count()  
topMovies=g.sort_values(ascending=False)[:15] 

top_r = ratings.join(topUsers, rsuffix='_r', how='inner', on='userId')
top_r = top_r.join(topMovies, rsuffix='_r', how='inner', on='movieId') 

pd.crosstab(top_r.userId, top_r.movieId, top_r.rating, aggfunc=np.sum) 

image.png

是包含上述信息的 excel 文件。 首先,我们将使用矩阵分解而不构建神经网络。

image.png

  • 蓝色单元格 - 实际评级
  • 紫色单元格 - 我们的预测
  • 红色单元格 - 我们的损失函数即均方根误差(RMSE)
  • 绿色单元格 - 电影嵌入(随机初始化)
  • 橙色单元格 - 用户嵌入(随机初始化)

每个预测是电影嵌入向量和用户嵌入向量的点积。 在线性代数术语中,它等于矩阵乘积,因为一个是行,一个是列。 如果没有实际评级,我们将预测设置为零(将其视为测试数据 - 而不是训练数据)。

image.png

然后我们使用梯度下降来减少损失。 Microsoft Excel 在加载项中有一个“求解器”,可以通过更改所选单元格来最小化变量(GRG Nonlinear是你要使用的方法)。

这可称为“浅学习”(与深度学习相反),因为没有非线性层或第二线性层。 那么我们直觉上做了什么呢? 每部电影的五个数字称为“嵌入”(潜在因式) - 第一个数字可能代表科幻和幻想的程度,第二个数字可能是电影使用了多少特效,第三个可能是对话驱动的程度。与之类似,每个用户还有 5 个数字,例如,表示用户喜欢幻想,特效和对话驱动的电影的程度。 我们的预测是这些向量的叉乘。 由于我们没有每个用户的每个电影评论,因此我们试图找出哪些电影与这部电影相似,以及其他用户评价其他电影,如何与这个用户评价这个电影类似(因此称为“协同”)。

我们如何处理新用户或新电影 - 我们是否需要重新训练模型? 我们现在没有时间来讨论这个问题,但基本上你需要有一个新的用户模型或最初会使用的新电影模型,随着时间的推移你需要重新训练模型。

阅读更多

相关文章
|
29天前
|
机器学习/深度学习 人工智能 PyTorch
【Hello AI】安装和使用AIACC-AGSpeed(优化PyTorch深度学习模型)
AIACC-AGSpeed(简称AGSpeed)专注于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,可以实现无感的计算优化性能。本文为您介绍安装和使用AGSpeed的方法。
|
1月前
|
机器学习/深度学习 人工智能 分布式计算
阿里云PAI:一站式AI研发平台,引领深度学习潮流
阿里云PAI:一站式AI研发平台,引领深度学习潮流 随着人工智能的飞速发展,深度学习框架已经成为AI研发的核心工具。然而,选择合适的深度学习框架并不容易,需要考虑的因素包括计算性能、易用性、支持的算法组件等多种因素。今天,我们就来介绍一款一站式AI研发平台——阿里云PAI,看看它如何解决这些痛点。
53 1
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
【Hello AI】神龙AI加速引擎AIACC-加速深度学习应用
神龙AI加速引擎AIACC是基于阿里云IaaS资源推出的AI加速引擎,用于优化基于AI主流计算框架搭建的模型,使用AIACC可加速深度学习应用,能显著提升模型的训练和推理性能。
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
极智AI | 教你使用深度学习模型调试器polygraphy
大家好,我是极智视界,本文讲解一下 深度学习模型调试器 polygraphy 的使用方法。
137 0
|
4月前
|
机器学习/深度学习 人工智能 Python
深度学习AI克隆人声模型
深度学习AI克隆人声模型
100 0
|
9月前
|
机器学习/深度学习 运维 固态存储
AI-无损检测方向速读:基于深度学习的表面缺陷检测方法综述
在真实复杂的工业环境下,表面缺陷检测往往面临诸多挑战,例如存在缺陷成像与背景差异小、对比度低、缺陷尺度变化大且类型多样,缺陷图像中存在大量噪声,甚至缺陷在自然环境下成像存在大量干扰等情形,如图1所示,此时经典方法往往显得束手无策,难以取得较好的效果。
755 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史(3)
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史
214 0
|
9月前
|
机器学习/深度学习 人工智能 算法
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史(2)
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史
128 0
|
9月前
|
机器学习/深度学习 存储 人工智能
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史(1)
人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史
151 0
|
9月前
|
机器学习/深度学习 存储 人工智能
2012-2022: AI革命10周年,Hinton等大佬重拳出击「深度学习撞墙」论
2012-2022: AI革命10周年,Hinton等大佬重拳出击「深度学习撞墙」论
132 0

相关产品