《深度学习导论及案例分析》一第2章预 备 知 识2.1矩阵运算

简介:

#### 本节书摘来自华章出版社《深度学习导论及案例分析》一书中的第2章,第2.1节,作者李玉鑑 张婷,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第2章

预 备 知 识

深度学习的理论和模型涉及较多的预备知识,包括矩阵运算、概率论、信息论、图模型、马尔可夫链蒙特卡罗方法,等等。本章主要对这些预备知识进行梳理和介绍,特别是概率有向图模型(或称贝叶斯网络)、概率无向图模型(或称马尔可夫网络)和部分有向无圈图模型(或称链图模型)的有关知识,对理解受限玻耳兹曼机、深层信念网络和深层玻耳兹曼机的模型结构非常重要。而且,本章将专门讨论玻耳兹曼机模型,其学习算法涉及马尔可夫链、吉布斯采样和变分方法,有助于掌握受限玻耳兹曼机、深层信念网络和深层玻耳兹曼机的核心内容。此外,本章还将针对前馈神经网络建立一个通用反向传播算法,有助于推导和理解其他各种深层网络的具体反向传播算法。最后,简要介绍人工神经网络的通用逼近定理。

2.1矩阵运算

虽然本书假定读者已经掌握了基本的线性代数和高等数学知识,但为了方便理解,本节首先总结一些常用的矩阵运算及偏导公式。

给定两个矩阵A=(aij)m×n和B=(bij)m×n,它们的阿达马积和克罗内克积定义如下:
阿达马积(Hadamard product)AB=(aij•bij)m×n,又称逐元素积(elementwise product)。
克罗内克积(Kronnecker product)AB=a11B…a1nB



am1B…amnB

如果a、b、c和x是n维向量,A、B、C和X是n阶矩阵,那么
(aTx)x=(xTa)x=a(2.1)

(aTXb)X=abT(2.2)

(aTXTb)X=baT(2.3)

(aTXa)X=(aTXTa)X=aaT(2.4)

(aTXTXb)X=X(abT+baT)(2.5)

[(Ax+a)TC(Bx+b)]x=ATC(Bx+b)+BTC(Ax+a)(2.6)

(xTAx)x=(A+AT)x(2.7)

[(Xb+c)TA(Xb+c)]X=(A+AT)(Xb+c)bT(2.8)

[bTXTAXc]X=ATXbcT+AXcbT(2.9)

如果f是一元函数,那么其逐元向量函数和逐元矩阵函数定义为:

逐元向量函数(elementwise vector function)f(x)=(f(x1),f(x2),…,f(xn))T=(f(xi))T


逐元矩阵函数(elementwise matrix function)f(X)=f(xij)


本书把它们统称为逐元函数(elementwise function),比如逐元sigmoid函数、逐元tanh函数。

逐元函数的导数分别为f′(x)=(f′(x1),f′(x2),…,f′(xn))T和f′(X)=(f′(xij))。

如果用Tr(.)表示矩阵的迹函数(即计算矩阵的对角元素之和),那么不难得到:
[Tr(f(X))]X=(f′(X))T(2.10)

[Tr(sin(X))]X=(cos(X))T(2.11)
如果U=F(X)是关于X的矩阵值函数且g(U)是关于U的实值函数,那么下面的链式法则(chain rule)成立:
g(U)X=g(U)xij=∑k∑lg(U)ukluklxij=Trg(U)UTUxij(2.12)
此外,关于矩阵迹函数Tr(.)还有如下偏导公式:
[Tr(AXB)]X=ATBT(2.13)

[Tr(AXTB)]X=BA(2.14)

[Tr(AX)]X=Tr(A)I(2.15)

[Tr(AXBX)]X=ATXTBT+BTXAT(2.16)

[Tr(CTXTBXC)]X=(BT+B)XCCT(2.17)

[Tr(XTBXC)]X=BXC+BTXCT(2.18)

[Tr(AXBXTC)]X=ATCTXBT+CAXB(2.19)

[Tr((AXB+C)(AXB+C)T)]X=2AT(AXB+C)BT(2.20)
相关文章
|
11月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费模式分析的深度学习模型
使用Python实现智能食品消费模式分析的深度学习模型
298 70
|
8月前
|
机器学习/深度学习 运维 自然语言处理
当深度学习遇上故障根因分析:运维人的绝佳拍档
当深度学习遇上故障根因分析:运维人的绝佳拍档
376 17
|
11月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费习惯分析的深度学习模型
使用Python实现智能食品消费习惯分析的深度学习模型
293 68
|
9月前
|
机器学习/深度学习 文字识别 自然语言处理
分析对比大模型OCR、传统OCR和深度学习OCR
OCR技术近年来迅速普及,广泛应用于文件扫描、快递单号识别、车牌识别及日常翻译等场景,极大提升了便利性。其发展历程从传统方法(基于模板匹配和手工特征设计)到深度学习(采用CNN、LSTM等自动学习高级语义特征),再到大模型OCR(基于Transformer架构,支持跨场景泛化和少样本学习)。每种技术在特定场景下各有优劣:传统OCR适合实时场景,深度学习OCR精度高但依赖大量数据,大模型OCR泛化能力强但训练成本高。未来,大模型OCR将结合多模态预训练,向通用文字理解方向发展,与深度学习OCR形成互补生态,最大化平衡成本与性能。
|
11月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费市场分析的深度学习模型
使用Python实现智能食品消费市场分析的深度学习模型
326 36
|
11月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费趋势分析的深度学习模型
使用Python实现智能食品消费趋势分析的深度学习模型
325 18
|
机器学习/深度学习 算法 PyTorch
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU、WIOU损失函数分析及Pytorch实现
这篇文章详细介绍了多种用于目标检测任务中的边界框回归损失函数,包括IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU和WIOU,并提供了它们的Pytorch实现代码。
2747 1
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU、WIOU损失函数分析及Pytorch实现
|
机器学习/深度学习 监控 PyTorch
深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析
在深度学习框架的选择上,PyTorch Lightning和Ignite代表了两种不同的技术路线。本文将从技术实现的角度,深入分析这两个框架在实际应用中的差异,为开发者提供客观的技术参考。
330 7
|
11月前
|
机器学习/深度学习 人工智能 计算机视觉
深度学习在医疗影像分析中的应用与挑战
本文探讨了深度学习技术在医疗影像分析领域的应用现状和面临的主要挑战。随着人工智能技术的飞速发展,深度学习已经成为推动医疗影像诊断自动化和智能化的重要力量。文章首先概述了深度学习的基本原理及其在图像识别任务中的优势,随后详细讨论了其在CT、MRI等医疗影像处理中的成功案例,并分析了当前技术面临的数据隐私、模型解释性以及临床验证等方面的挑战。最后,提出了未来研究的方向和可能的解决方案,旨在促进深度学习技术在医疗领域的更广泛应用。
292 0
|
12月前
|
机器学习/深度学习 数据采集 供应链
使用Python实现深度学习模型:智能食品市场分析
使用Python实现深度学习模型:智能食品市场分析
198 0

热门文章

最新文章