分类|深度学习(李宏毅)(二)

简介: 分类|深度学习(李宏毅)(二)

一、生成模型

QQ图片20220531174408.png

二、计算某一类样本的高斯分布


根据已有的标签数据可以求得每一类均值和方差的估计,由于该类样本服从高斯分布,则其似然如下:


QQ图片20220531174440.png


三、逻辑回归(判别模型)推导

QQ图片20220531174544.png


QQ图片20220531174546.png

QQ图片20220531174710.png

QQ图片20220531174754.png


四、逻辑回归的损失函数


QQ图片20220531174843.png

QQ图片20220531174922.png

QQ图片20220531174922.png上面的结论表明当使用交叉熵作为损失函数时,如果预测值与实际值有较大的差距时会产生较大的梯度更新。


  1. 均方误差损失函数


QQ图片20220531175007.png

交叉熵与均方误差的图像如下:

QQ图片20220531175041.png


                                                  交叉熵vs均方误差


  1. 总结

关于为什么使用交叉熵而不使用均方误差,总结如下:


①神经网络中如果预测值与实际值的误差越大,那么在反向传播训练的过程中,各种参数调整的幅度就要更大,从而使训练更快收敛,如果预测值与实际值的误差小,各种参数调整的幅度就要小,从而减少震荡。


②使用平方误差损失函数,误差增大参数的梯度会增大,但是当误差很大时,参数的梯度就会又减小了。


③使用交叉熵损失是函数,误差越大参数的梯度也越大,能够快速收敛。


五、判别模型 vs 生成模型


QQ图片20220531175158.png

生成模型的优点:


①因为生成模型有一个先验的假设,所以需要更少的训练数据,而且对噪声有更高的鲁棒性。


②先验分布和类别依赖的概率分布可以从不同的来源估计。


相关文章
|
1月前
|
机器学习/深度学习 数据采集 PyTorch
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
|
3月前
|
机器学习/深度学习 存储 计算机视觉
python深度学习图像处理CSV文件分类标签图片到各个文件夹
python深度学习图像处理CSV文件分类标签图片到各个文件夹
65 0
|
7月前
|
机器学习/深度学习 数据挖掘 语音技术
基于对数谱图的深度学习心音分类
这是一篇很有意思的论文,他基于心音信号的对数谱图,提出了两种心率音分类模型,我们都知道:频谱图在语音识别上是广泛应用的,这篇论文将心音信号作为语音信号处理,并且得到了很好的效果。
56 1
|
2月前
|
机器学习/深度学习 搜索推荐 PyTorch
基于Pytorch深度学习的脑肿瘤分类识别
基于Pytorch深度学习的脑肿瘤分类识别
68 0
|
2月前
|
机器学习/深度学习 数据可视化 TensorFlow
基于tensorflow深度学习的猫狗分类识别
基于tensorflow深度学习的猫狗分类识别
61 1
|
3月前
|
机器学习/深度学习 自然语言处理 数据格式
训练你自己的自然语言处理深度学习模型,Bert预训练模型下游任务训练:情感二分类
训练你自己的自然语言处理深度学习模型,Bert预训练模型下游任务训练:情感二分类
55 0
|
4月前
|
机器学习/深度学习 编译器 TensorFlow
基于Python TensorFlow Estimator的深度学习回归与分类代码——DNNRegressor
基于Python TensorFlow Estimator的深度学习回归与分类代码——DNNRegressor
|
8月前
|
机器学习/深度学习 存储 算法
【使用深度学习的城市声音分类】使用从提取音频特征(频谱图)中提取的深度学习进行声音分类研究(Matlab代码实现)
【使用深度学习的城市声音分类】使用从提取音频特征(频谱图)中提取的深度学习进行声音分类研究(Matlab代码实现)
132 0
|
8月前
|
机器学习/深度学习 存储 算法
【使用机器学习和深度学习对城市声音进行分类】基于两种技术(ML和DL)对音频数据(城市声音)进行分类(Matlab代码实现)
【使用机器学习和深度学习对城市声音进行分类】基于两种技术(ML和DL)对音频数据(城市声音)进行分类(Matlab代码实现)
171 0
|
9月前
|
机器学习/深度学习 数据可视化 计算机视觉
使用深度学习进行图像类别分类
使用预训练卷积神经网络 (CNN) 作为特征提取器来训练图像类别分类器。
93 0