深度学习基础

简介: 深度学习的基础知识点

1 机器学习、深度学习、人工智能

1.1 机器学习

机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。
基本步骤:获取数据、数据预处理、特征提取、特征选择、推理预测识别(数据预处理、特征提取、特征选择合称为特征表达)

1.2 监督学习

监督学习,是其训练集的数据是提前分好类,带有标签的数据,进行学习到模型以及参数。

1.3 非监督学习

非监督学习,需要将一系列没有标签的训练数据,输入到算法中,需要根据样本之间的相似性对样本集进行分类或者分析。

2 模型相关

2.1 判别模型和生成模型

生成式模型:由数据学习联合概率分布P(X,Y),然后由P(Y|X)=P(X,Y)/P(X),求出概率分布P(Y|X)作为预测的模型,该方法表示了给定输入X与输出Y之间的生成关系。
判别式模型:由数据直接学习决策函数y=f(x)或者条件概率分布P(Y|X)作为预测模型,判别方法关心的是对于给定输入X应预测出什么样的输出Y。
判别式模型方便很多,因为生成式模型要学习一个X,Y的联合分布往往需要很多数据,而判别式模型需要的数据则相对少,因为判别式模型更关注输入特征的差异性。不过生成式既然使用了更多数据来生成联合分布,自然也能够提供更多的信息

2.2 回归模型

回归模型正是表示从输入变量到输出变量之间映射的函数。例如,线性回归代表目标值预期是输入变量的线性组合。

2.3 多层神经网络

由输入层、输出层、隐藏层组成:

  1. 输入层:接受与处理训练数据集中的各输入变量值
  2. 隐层:实现非线性数据的线性变换
  3. 输出层:给出输出变量的分类或预测结果

3 正则化

经常使用的是L1和L2正则化(L2>L1),思想是在损失函数增加一项(正则项)。

3.1 L2正则化

正则项为权重的平方和,公式为:

其中是不添加正则化的损失函数。

3.2 L1正则化

正则项为权重的和,公式为:

3.3 偏差和方差

偏差是描述模型的期望预测与真实结果之间的偏离程度。偏差大说明模型拟合能力差,此时欠拟合。
方差是描述数据扰动造成的模型性能的变化,即模型在不同数据集上的稳定程度。方差大,说明模型稳定性差,训练集上拟合优秀,测试集上拟合差,则方差大,此时过拟合。

3.4 欠拟合

欠拟合,模型参数学习的过少,模型不能很好地拟合数据

3.5 过拟合

过拟合:把一些不必要的特征过度计算了

4 数据集相关

评估方法就是如何划分数据集,应该要求测试集与训练集之间互斥,用测试集来预测评估模型方法。

4.1 留出法

就是将整个数据集按照某种比例进行划分成训练集和测试集,训练集和测试集比例一般为7:3。

4.2 交叉验证法

将全部数据集S分成 k个不相交的子集,每次从分好的子集中里面,拿出一个作为测试集,其它k-1个作为训练集,根据训练集训练出模型,放到测试集上,得出结果。计算k次求得的结果的平均值,作为该模型的真实结果。

如果k太大,误差估计的偏差很小。但是误差估计的方差很大(由于验证点少)计算时间非常大(试验次数多),会导致过拟合。
如果k太小,计算量小,计算时间短。但是误差估计的方差小(由于验证点多)误差估计的偏差会很大,会导致欠拟合。

4.3 留一法

交叉验证法的一种,每次只留下一个样本做测试集,其它样本做训练集,如果有k个样本,则需要训练k次,测试k次(注意这里是以样本为单位,交叉验证法以子集为单位)。
适合小样本数据

4.4 自助法

留出法每次从数据集D中抽取一个样本加入数据集D'中,然后再将该样本放回到原数据集D中,即D中的样本可以被重复抽取。这样,D中的一部分样本会被多次抽到,而另一部分样本从未被抽到。

5 最大似然学习

已经知道结果,寻找使该结果出现可能性最大的参数的过程。计算步骤如下:

  1. 写出似然函数
  2. 对似然函数取对数
  3. 求导,令导数为0得到似然方程
  4. 解似然方程得到参数
相关文章
|
人工智能 算法 PyTorch
TorchAcc:基于 TorchXLA 的分布式训练框架
阿里云研究员、阿里云人工智能平台 PAI 技术负责人--林伟在GTC 2024 大会 China AI Day 线上中文演讲专场上介绍了TorchAcc,这是一个基于 PyTorch/XLA 的大模型分布式训练框架。
|
前端开发 JavaScript 定位技术
folium底图本地化处理
folium底图本地化处理
591 0
|
7月前
|
图形学
Unity时间转换方式
**时间戳与 DateTime 的转换简介** 时间戳是从1970年1月1日00:00:00起的秒数,可转为 DateTime 对象。DateTime 转时间戳则是计算与1970年1月1日的时间差。秒数与时分秒格式互转基于60进制换算规则。Unity 中可通过 Time 类处理游戏时间,并与其他时间格式进行换算,需考虑时区等差异。示例代码展示了 Unity 中计时器的实现及总用时转换成时分秒的两种方法。
376 10
|
Kubernetes API Docker
Mac docker-desktop 安装单机版k8s
Mac docker-desktop 安装单机版k8s
856 0
|
11月前
|
Web App开发 Java iOS开发
webp详解
WebP是一种由谷歌开发的图像文件格式,旨在提供更高效的图像压缩方法,以加快网页加载速度。它支持有损和无损压缩模式,并且在相同的视觉质量下,相比JPEG和PNG等格式,文件大小更小,从而优化了网络传输效率。此外,WebP还支持透明度和动画图像。
|
算法 JavaScript
「AIGC算法」将word文档转换为纯文本
使用Node.js模块`mammoth`和`html-to-text`,该代码示例演示了如何将Word文档(.docx格式)转换为纯文本以适应AIGC的文本识别。流程包括将Word文档转化为HTML,然后进一步转换为纯文本,进行格式调整,并输出到控制台。转换过程中考虑了错误处理。提供的代码片段展示了具体的实现细节,包括关键库的导入和转换函数的调用。
281 0
|
SQL 存储 NoSQL
附PPT下载|DTCC演讲:降本增效,阿里云一站式数据库上云最佳实践
在第十三届中国数据库技术大会(DTCC 2022)上,阿里云数据库高级解决方案架构师王林平从上云路径、云上数据库使用实践及使用进阶等方案深入介绍了阿里云一站式数据库上云最佳实践。 本文内容根据演讲录音以及PPT整理而成。
附PPT下载|DTCC演讲:降本增效,阿里云一站式数据库上云最佳实践
【Log4cpp】项目日志Log4cpp的简单使用
【Log4cpp】项目日志Log4cpp的简单使用
|
存储
5.3.1_原补码的乘法运算
计算机组成原理之原补码的乘法运算
567 2
5.3.1_原补码的乘法运算
|
缓存 网络安全 开发工具
GitLab上传文件 和 GitLab配置ssh key
GitLab上传文件 和 GitLab配置ssh key
427 0

热门文章

最新文章