【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.2)

简介: 【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.2)

【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.2)

1.2 偏差/方差

1ecd1b2606ed46e9956a89f231c9802c.png

假设图中的ooxx代表数据集,现用一条直线去拟合左图的数据,可能会得到一个逻辑回归拟合,但是可以看到这条直线并不能很好的拟合数据,这种就属于高偏差情况,通常称为欠拟合。

而对于一个非常复杂的分类器,比如深度神经网络或者含有隐藏单元的神经网络,就适用于右边的数据集,但也不是一个合适的拟合方式,这种属于分类器高方差情况,称为过拟合。

中间的图就是分类器复杂程度适中,数据拟合适度,称为适度拟合。

上图例子是只有两个特征的二维数据集,可以直观的看到方差和偏差是怎么一回事,对于高维空间,可以用一些指标来判断。

1ecd1b2606ed46e9956a89f231c9802c.png

用猫狗识别这个例子来说明。首先理解方差和偏差的两个关键数据是训练集误差和验证集误差,为了论证方差和偏差与训练集误差和验证集误差相关,假定我们的肉眼可以很准确的识别出图中对象是猫咪。现假定训练集的错误率是1%,而验证集错误率设置成11%,这种情况就是把训练集错误率设置的很好,而验证集设置的相对较差,我们就可能过度拟合了训练集,因此,在某种程度上,验证集就没有发挥它交叉验证的作用。这就可以称之为高方差。进而论证了,通过看训练集和验证集的误差来判断某个算法是否存在高偏差。

于是,我们可以通过衡量这个指标然后得到不同的结论。假设训练集误差是15%,验证集误差是16%(在这个例子中假定识别图片的错误率是0)。可以看到算法在训练集没有得到很好的训练,故数据拟合度不高,这就是前面提到的欠拟合,就可以说这种算法偏差较高。16%的验证集误差的结果在这是合理的,它与训练集误差相差只有1%,故属于高偏差情况,这与上面左图一样。

再假设,把训练集误差设为15%,验证集误差设为30%,可以看到验证评估没有达到很好的效果,这种情况属于高偏差,高方差。

最后一种情况就是把它两分别设置成0.5%和1%,这种就是低偏差,低方差,这会是人们想看到的结果。但是在此例中,因为假定了人眼识别的错误率是0%,所以这个要被考虑的因素暂时丢弃了。通常情况下,最优误差称之为贝叶斯误差,而最优误差理应要达到0%。但如果最优误差或者贝叶斯误差达到15%,那么第二个例子15%的训练集误差和16%的验证集误差,它们就属于低偏差低方差了。


假如猫狗图片不适用于所有的分类器,即图片很模糊,就是说人眼或者任何系统都无法很好的识别出猫咪,这就属于最优误差很高的情况了。

再来看下高偏差和高方差在刚才图中是什么样子的:

1ecd1b2606ed46e9956a89f231c9802c.png

可以看到,线性分类器数据拟合度低,属于高偏差情况;紫色线画出来的过度拟合了部分数据,这就属于高偏差高方差的分类器。

故线性分类器偏差很高,而采用曲线函数或二次元函数,会产生高方差,因为曲线灵活性太高,会拟合错误的样本。


相关文章
|
6月前
|
机器学习/深度学习 人工智能 运维
网管不再抓头发:深度学习教你提前发现网络事故
网管不再抓头发:深度学习教你提前发现网络事故
149 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
深度学习实战指南:从神经网络基础到模型优化的完整攻略
🌟 蒋星熠Jaxonic,AI探索者。深耕深度学习,从神经网络到Transformer,用代码践行智能革命。分享实战经验,助你构建CV、NLP模型,共赴二进制星辰大海。
|
5月前
|
机器学习/深度学习 人工智能 算法
Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!
Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!
279 68
|
4月前
|
机器学习/深度学习 算法 数据库
基于GoogleNet深度学习网络和GEI步态能量提取的步态识别算法matlab仿真,数据库采用CASIA库
本项目基于GoogleNet深度学习网络与GEI步态能量图提取技术,实现高精度步态识别。采用CASI库训练模型,结合Inception模块多尺度特征提取与GEI图像能量整合,提升识别稳定性与准确率,适用于智能安防、身份验证等领域。
|
8月前
|
机器学习/深度学习 人工智能 运维
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
266 8
|
9月前
|
机器学习/深度学习 数据采集 算法
基于MobileNet深度学习网络的MQAM调制类型识别matlab仿真
本项目基于Matlab2022a实现MQAM调制类型识别,使用MobileNet深度学习网络。完整程序运行效果无水印,核心代码含详细中文注释和操作视频。MQAM调制在无线通信中至关重要,MobileNet以其轻量化、高效性适合资源受限环境。通过数据预处理、网络训练与优化,确保高识别准确率并降低计算复杂度,为频谱监测、信号解调等提供支持。
|
9月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
501 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
9月前
|
机器学习/深度学习 存储 算法
基于MobileNet深度学习网络的活体人脸识别检测算法matlab仿真
本内容主要介绍一种基于MobileNet深度学习网络的活体人脸识别检测技术及MQAM调制类型识别方法。完整程序运行效果无水印,需使用Matlab2022a版本。核心代码包含详细中文注释与操作视频。理论概述中提到,传统人脸识别易受非活体攻击影响,而MobileNet通过轻量化的深度可分离卷积结构,在保证准确性的同时提升检测效率。活体人脸与非活体在纹理和光照上存在显著差异,MobileNet可有效提取人脸高级特征,为无线通信领域提供先进的调制类型识别方案。
|
3月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
337 0
|
3月前
|
机器学习/深度学习 传感器 算法
【无人车路径跟踪】基于神经网络的数据驱动迭代学习控制(ILC)算法,用于具有未知模型和重复任务的非线性单输入单输出(SISO)离散时间系统的无人车的路径跟踪(Matlab代码实现)
【无人车路径跟踪】基于神经网络的数据驱动迭代学习控制(ILC)算法,用于具有未知模型和重复任务的非线性单输入单输出(SISO)离散时间系统的无人车的路径跟踪(Matlab代码实现)
207 2