一、深度学习简介

简介: 一、深度学习简介

1、什么是神经网络



一个关于房价预测的简单神经网络示意图如下图所示:

fade5fb478284f3c8d01296ddec7ad98.png


其中,最左测的所有特征称为输入层(Input layer),中间一层称为全连接层(dense layer),最右侧一层称为输出层(output layer)。



2、使用神经网络做监督学习


使用神经网咯做监督学习的使用案例如下所示:

image.png


基本神经网络,卷积神经网络(CNN)和循环神经网络(RNN)的示意图如下图所示:

image.png



结构化数据: 每一个特征的数据都能都被准确地进行量化,如房价,房间数量;用户年龄,用户ID,etc。


非结构化数据: 当输入的信息时声音,图片或者文本时,特征的数据无法准确地进行量化,如图像可以使用像素,文本可以使用单次编码。



3、使用神经网络做逻辑回归


 加入我们现在的目标是通过二元分类来判断某张图片是否中的图像是否是“猫”,则首先需要将图片的像素值提取出来作为神经网络的输入特征向量,假如一幅图片的大小为64×64个像素点,而每一个像素点又包括红黄蓝三种色彩,将所有的像素点伸缩称为一个特征向量x,则x的大小为64×64×3。


image.png


3.1 符号定义


单个样本(x,y),x∈Rn,y∈{0,1},其中x表示特征向量,y表示真值。


m个训练样本: {(x(1),y(1)),(x(2),y(2)),...,(x(m),y(m)),};


所有特征组成的向量集合  X=[x(1),x(2),...,x(m)],X∈R(n×m);


所有真值的集合  Y=[y(1),y(2),...,y(m)]



3.2 逻辑回归模型


给定一组训练数据,需要预测y^=P(y=1∣x);给定参数:w∈Rn,b∈Rn;输出预测值 y^=σ(wTx+b)。其中, sigmoid=1+e−z1函数图像如下所示:


e7188bfd836145fdac375f41f9bf7b15.png




逻辑回归模型使用交叉熵误差: L(y^,y)=−(ylogy^+(1−y)log(1−y^)),使用交叉熵误差的原因如下所示:

87a4ca80e0e04da59db9314865354132.png


逻辑回归的成本函数如下所示: J(w,b)=m1∑i=1mL(y^,y)




3.3 使用梯度下降训练神经网络


神经网络的成本函数是 J(w,b),目标是选择合适的参数  w,b使得成本函数  J(w,b)尽可能地小,所以使用梯度下降时,首先需要计算 J(w,b)关于参数 w,b的偏导数,之后让参数 w,b沿着导数的方向进行移动,直到算法收敛。参数 w,b更新的方式如下所示:

image.png



3.4 计算图


计算图从左到右计算损失函数    J的值,从右到左计算计算图中每一个参数的梯度,下图是一个计算图的示例:

a7857c509d0b44b38d1063da823e3115.png

3.5 逻辑回归中的梯度下降

逻辑回归的模型和计算图如下图所示:

feba4945dc144dd49c5b68e607d70b78.png

逻辑回归模型反向传播计算过程如下图所示:

d22a4ea2150b46e7bb0dfc9c4249cd92.png




3.6 多样本下的梯度下降


m个样本下的逻辑回归模型的梯度下降算法流程如下所示:

d4f83443ee9c4f48b22acb2943fcf000.png

相关文章
|
7月前
|
机器学习/深度学习
【从零开始学习深度学习】33.语言模型的计算方式及循环神经网络RNN简介
【从零开始学习深度学习】33.语言模型的计算方式及循环神经网络RNN简介
【从零开始学习深度学习】33.语言模型的计算方式及循环神经网络RNN简介
|
7月前
|
机器学习/深度学习
【从零开始学习深度学习】37. 深度循环神经网络与双向循环神经网络简介
【从零开始学习深度学习】37. 深度循环神经网络与双向循环神经网络简介
|
8月前
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
260 4
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】机器学习、深度学习、强化学习和迁移学习简介、相互对比、区别与联系。
机器学习、深度学习、强化学习和迁移学习都是人工智能领域的子领域,它们之间有一定的联系和区别。下面分别对这四个概念进行解析,并给出相互对比、区别与联系以及应用场景案例分析。
202 1
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)简介
【8月更文挑战第30天】在人工智能的浪潮中,深度学习以其强大的数据处理能力成为时代的宠儿。本文将深入浅出地介绍深度学习的一个重要分支——卷积神经网络(CNN),并探讨其如何在图像识别等领域大放异彩。通过实例,我们将一窥CNN的神秘面纱,理解其背后的原理,并探索如何利用这一工具解锁数据的深层价值。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
176 9
|
8月前
|
机器学习/深度学习 自然语言处理 算法
深度学习算法简介(二)
深度学习算法简介(二)
|
8月前
|
机器学习/深度学习 人工智能 算法
深度学习1(知识简介)
深度学习1(知识简介)
|
8月前
|
机器学习/深度学习 自然语言处理 算法
深度学习算法简介(一)
深度学习算法简介(一)
166 0
|
8月前
|
机器学习/深度学习 数据采集 测试技术