放弃深度学习?我承认是因为线性代数

简介:

深度学习从入门到放弃?一定是哪里出了问题。

这篇文章想来和你探讨下:深度学习背后的线性代数问题。

放弃深度学习?我承认是因为线性代数

先做个简单的名词解释

深度学习:作为机器学习的一个子域,关注用于模仿大脑功能和结构的算法:人工神经网络。

线性代数:连续的而不是离散的数学形式,许多计算机科学家不太了解它。对于理解和使用许多机器学习算法,特别是深度学习算法,理解线性代数是非常重要的。

为什么需要数学?

线性代数,概率和微积分是机器学习用于表述的「语言」。学习这些主题将有助于深入理解底层算法机制,便于开发新算法。

当限定在更小的层次时,深度学习背后的基础都是数学。所以在开始深度学习和编程之前,理解基本的线性代数是至关重要的。

放弃深度学习?我承认是因为线性代数

src

深度学习背后的核心数据结构是标量,向量,矩阵和张量。让我们以编程方式用这些解决所有基本的线性代数问题。

标量

标量是单个数字,是一个 0 阶张量的例子。符号 x∈ℝ 表示 x 是一个标量,属于一组实数值 ℝ。

深度学习有不同的有趣的数字集合。ℕ 表示正整数集合(1,2,3,...)。ℤ 表示实数,包括正值,负值和 0。ℚ 表示有理数的集合,有理数可以表示为两个整数组成的分数。

Python 中内置一些标量类型 int,float,complex,bytes 和 Unicode。在 NumPy 这个 python 库中,有 24 种新的基本数据类型来描述不同类型的标量。有关数据类型的信息,请参阅此处的文档(https://docs.scipy.org/doc/numpy-1.14.0/reference/arrays.scalars.html)。

在 Python 中定义标量和一些操作:

下面的代码片段解释了对标量的几个算术运算。

放弃深度学习?我承认是因为线性代数

放弃深度学习?我承认是因为线性代数

以下代码片段检查给定变量是否是标量。

放弃深度学习?我承认是因为线性代数

放弃深度学习?我承认是因为线性代数

向量

向量是一维有序数组,是一阶张量的例子。向量被称为向量空间的对象的片段。向量空间可以被认为是特定长度(或维度)的所有可能向量的全部集合。三维实值向量空间(用 ℝ^3 表示)通常用于从数学角度表示我们对三维空间的现实世界概念。

放弃深度学习?我承认是因为线性代数

为了明确识别向量的必要成分,向量的第 i 个标量元素被写为 x [i]。

在深度学习中,向量通常表示特征向量,其原始组成部分定义特定特征的相关性。这些元素中可能包括二维图像中像素集强度的相关重要性或者金融工具的横截面的历史价格值。

Python 中定义向量和一些操作:

放弃深度学习?我承认是因为线性代数

放弃深度学习?我承认是因为线性代数

矩阵

矩阵是由数字组成的矩形阵列,是二阶张量的一个例子。如果 m 和 n 均为正整数,即 m, n ∈ ℕ,则矩阵包含 m 行 n 列,共 m*n 个数字。

完整的矩阵可写为:

放弃深度学习?我承认是因为线性代数

将所有矩阵的元素缩写为以下形式通常很有用。

放弃深度学习?我承认是因为线性代数

在 Python 语言中,我们使用 numpy 库来帮助我们创建 n 维数组。这些数组基本上都是矩阵,我们使用矩阵方法通过列表,来定义一个矩阵。

$python

放弃深度学习?我承认是因为线性代数

在 Python 中定义矩阵的操作:

矩阵加法

矩阵可以与标量、向量和其他的矩阵相加。这些运算都有严格的定义。这些技巧在机器学习和深度学习中会经常用到,所以值得熟练运用这些技巧。

放弃深度学习?我承认是因为线性代数

矩阵-矩阵加法

C=A+B(矩阵 A 和 B 应该有相同的形状)

这类方法返回矩阵的形状,并将两个参数相加后返回这些矩阵的总和。如果这些矩阵的形状不相同,则程序会报错,无法相加。

放弃深度学习?我承认是因为线性代数

矩阵-标量相加

将给定的标量加到给定矩阵的所有元素。

放弃深度学习?我承认是因为线性代数

矩阵-标量相乘

用给定的标量乘以给定矩阵的所有元素。

放弃深度学习?我承认是因为线性代数

矩阵乘法

矩阵 A 与矩阵 B 相乘得到矩阵 C。

放弃深度学习?我承认是因为线性代数

src

放弃深度学习?我承认是因为线性代数

矩阵转置

通过矩阵转置,你可以将行向量转换为列向量,反之亦然。

A=[aij]mxn

AT=[aji]n×m

放弃深度学习?我承认是因为线性代数

放弃深度学习?我承认是因为线性代数

张量

张量的更一般的实体封装了标量、向量和矩阵。在物理学科和机器学习中有时需要用到高于二阶的张量。

放弃深度学习?我承认是因为线性代数

src

我们使用像 tensorflow 或 Pytorch 这样的 Python 库来声明张量,而不是用嵌套矩阵。

在 Pytorch 中定义一个简单的张量:

放弃深度学习?我承认是因为线性代数

Python 中张量的几点算术运算

放弃深度学习?我承认是因为线性代数

有关张量和 Pytorch 的更多文档请点击此处(https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)。


原文发布时间为:2018-05-23

本文来自云栖社区合作伙伴“雷锋网”,了解相关信息可以关注“雷锋网”。

相关文章
|
5月前
|
机器学习/深度学习 人工智能 并行计算
现代深度学习框架构建问题之线性代数的常见概念定义如何解决
现代深度学习框架构建问题之线性代数的常见概念定义如何解决
48 3
|
机器学习/深度学习 算法
花书《深度学习》代码实现:01 线性代数:基本概念+代码实现基本运算
当机器学习问题中零和非零元素之间的差异非常重要时,在这些情况下,转而使用在各个位置斜率相同,通常会使用L1范数,也经常作为表示非零元素数目的替代函数。
234 0
|
机器学习/深度学习 Linux 应用服务中间件
|
9天前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
44 5
|
1天前
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
30 19
|
1天前
|
机器学习/深度学习 传感器 人工智能
探索深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过介绍卷积神经网络(CNN)的基本原理和架构设计,阐述了深度学习如何有效地从图像数据中提取特征,并在多个领域实现突破性进展。同时,文章也指出了训练深度模型时常见的过拟合问题、数据不平衡以及计算资源需求高等挑战,并提出了相应的解决策略。
26 7
|
11天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何利用这些原理进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习模型进行图像分类。最后,我们将讨论深度学习在图像识别领域的未来发展趋势和挑战。
|
11天前
|
机器学习/深度学习 数据采集 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的基本原理、优势以及面临的主要挑战。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率,同时指出了数据质量、模型泛化能力和计算资源等关键因素对性能的影响。
|
11天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用及其面临的挑战。通过分析深度学习模型如卷积神经网络(CNN)的工作原理,我们揭示了这些模型如何有效地处理和识别图像数据。同时,文章也指出了当前深度学习在图像识别中遇到的一些主要问题,包括过拟合、数据集偏差和模型解释性等,为读者提供了对这一领域全面而深入的理解。