【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.1)

简介: 【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.1)

【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面(1.1)

1.1训练/开发/测试集

如果想要构建一个高效的神经网络,那么配置训练、验证、测试集就要好好斟酌了。

在创建神经网络时,要做一些决策,包括网络有几层,每层有几个隐藏单元,学习率,各层用到的激活函数等。

但在实际应用中,我们不可能一开始就能够准确的预测出这些超参数的值,因而,可以说,应用型机器学习是一个高度迭代的过程。

1ecd1b2606ed46e9956a89f231c9802c.png

如果想要构建一个高效的神经网络,那么配置训练、验证、测试集就要好好斟酌了。

在创建神经网络时,要做一些决策,包括网络有几层,每层有几个隐藏单元,学习率,各层用到的激活函数等。

但在实际应用中,我们不可能一开始就能够准确的预测出这些超参数的值,因而,可以说,应用型机器学习是一个高度迭代的过程。

1ecd1b2606ed46e9956a89f231c9802c.png

把数据(样本)划分成训练集、验证集(交叉验证)和测试集,采用不同的算法对训练数据进行训练,然后通过验证集来选择出最好的算法,最后用测试集对该算法进行评估。

其中,对于数据规模较小的数据集来说,可以使用传统划分,即60%、20%、20%;而对于数据规模较大的数据集来说,训练数据占得比重较高,而验证集测试集比重小,因为验证的作用只是验证不同算法并选择出最好的,测试集是评估分类器的性能,它们各自所占比重足以进行评估。

紧接着,在实际应用中会遇到训练集和测试集不在同一个分布的问题,例如训练数据图片是高质量高像素的,而用户上传的数据图片是模糊不清晰的:

1ecd1b2606ed46e9956a89f231c9802c.png

解决这个问题的办法就是确保验证集和测试集在同一分布就可以了。

如果不想得到无偏差评估算法性能(测试集做的事),实际上也可以省略测试集,即验证集拟合到了测试集,直接通过验证集迭代出最优的训练算法。

总结:搭建训练、验证、测试集可以加速神经网络的集成,也可以有效衡量算法的偏差和方差,从而更高效的选择合适的方法来优化算法。

相关文章
|
6月前
|
机器学习/深度学习 人工智能 运维
网管不再抓头发:深度学习教你提前发现网络事故
网管不再抓头发:深度学习教你提前发现网络事故
149 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
深度学习实战指南:从神经网络基础到模型优化的完整攻略
🌟 蒋星熠Jaxonic,AI探索者。深耕深度学习,从神经网络到Transformer,用代码践行智能革命。分享实战经验,助你构建CV、NLP模型,共赴二进制星辰大海。
|
5月前
|
机器学习/深度学习 人工智能 算法
Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!
Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!
279 68
|
12月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
959 55
|
11月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
554 5
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
4月前
|
机器学习/深度学习 算法 数据库
基于GoogleNet深度学习网络和GEI步态能量提取的步态识别算法matlab仿真,数据库采用CASIA库
本项目基于GoogleNet深度学习网络与GEI步态能量图提取技术,实现高精度步态识别。采用CASI库训练模型,结合Inception模块多尺度特征提取与GEI图像能量整合,提升识别稳定性与准确率,适用于智能安防、身份验证等领域。
|
10月前
|
机器学习/深度学习 数据可视化 算法
PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络
神经常微分方程(Neural ODEs)是深度学习领域的创新模型,将神经网络的离散变换扩展为连续时间动力系统。本文基于Torchdyn库介绍Neural ODE的实现与训练方法,涵盖数据集构建、模型构建、基于PyTorch Lightning的训练及实验结果可视化等内容。Torchdyn支持多种数值求解算法和高级特性,适用于生成模型、时间序列分析等领域。
510 77
PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络
|
8月前
|
机器学习/深度学习 人工智能 运维
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
266 8
|
9月前
|
机器学习/深度学习 数据采集 算法
基于MobileNet深度学习网络的MQAM调制类型识别matlab仿真
本项目基于Matlab2022a实现MQAM调制类型识别,使用MobileNet深度学习网络。完整程序运行效果无水印,核心代码含详细中文注释和操作视频。MQAM调制在无线通信中至关重要,MobileNet以其轻量化、高效性适合资源受限环境。通过数据预处理、网络训练与优化,确保高识别准确率并降低计算复杂度,为频谱监测、信号解调等提供支持。
|
9月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
501 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能