PRML第一章读书小结

简介: PRML第一章读书小结

PRML第一章读书小结

    第一章用例子出发,较为简单的引入了概率论、模型、决策、损失、信息论的问题,作为机器学习从业者,读PRML除了巩固已有基础,还受到了很多新的启发,下面将我收到的启发总结如下。

1. 多项式曲线拟合问题

多项式拟合问题作为全书的第一个引例,通过此说明了很多关键的概念。


image.png

正则化后的进行多项式拟合效果就能达到一个理想的值。

之后,作者在重新考察曲线拟合问题时,提到了最大化似然函数和最小化平方和误差函数,而最大化后验概率等价于最小化正则化的误差函数。

2. 概率论

文章首先通过简单的例子说明了概率论的基本思想,然后表示了概率论的两条基本规则:

image.png

image.png


2.1 概率论之贝叶斯学派和频率学派

    频率学派试图从自然的角度出发,试图直接为事件建模,即事件A在独立重复实验中发生的频率趋于极限P,那么这个极限就是事件的概率。

    贝叶斯学派并不试图刻画事件本身,而是从观察者角度。贝叶斯学派并不认为事件本身是随机的,而是从观察者知识不完备这一出发点开始,构造一套贝叶斯概率论的框架下可以对不确定知识作出推断的方法。即不认为事件本身具有某种客观的随机性,而只是观察者不知道事件的结果

    频率学派广泛使用极大似然进行估计,使得似然函数p(D|w)达到最大。贝叶斯学派广泛使用先验概率。

    补充:根据知乎某大佬所言:频率学派和贝叶斯学派最大差别是产生在对参数空间的认知上。频率学派并不关心参数空间的所有细节,而相信数据都是在某个参数值下产生的,所以频率学派从“那个值最有可能是真实值”出发的。有了极大似然和置信区间。贝叶斯学派关心参数空间的每一个值,我们又没有上帝视角,怎么可能知道哪个值是真的,参数空间的每个值都有可能是真实模型使用的值,只是概率不同。

参考:https://www.zhihu.com/question/20587681

2.2 高斯分布

    高斯分布算是模式识别里面的重点难点,在第一章里面简要介绍了其一些简单性质,总结如下:

image.png

image.png


高斯分布的极大似然估计对均值的估计是无偏的,对方差的估计是有偏的(低估)。

3.模型选择

在曲线拟合中,存在一个最优的多项式阶数。实际情况中,我们可能存在多个控制模型复杂度的参数,同时存在过拟合现象,所以我们需要一个验证集。而数据有限,所以需要交叉验证,S-1组进行训练,1组进行评估,运行S次。但是存在一个问题就是训练本身很耗时。

4. 维数灾难

随着维数的变高,我们需要指数级的训练数据。对于高维数据,高斯分布的概率质量集中在薄球壳上。这对我们的模型产生了极大地困难。

5. 决策论

  1. 最小化错误分类率。把每个点分在后验概率最大的类别中,那么我们分类错误的概率就会最小。
  2. 最小化期望损失。损失函数(代价函数)最小。
  3. 拒绝选项。对于低于阈值的概率,拒绝作出识别,拒绝决策带来的损失可以放在损失矩阵中。

6.信息论


image.png

7. 一些小的知识点:

  1. 严格凸函数:每条弦位于函数图像上方,即二阶导数为正
  2. 变分法
  3. 高维空间中,球的大部分体积都聚集在表面附近。
  4. 具体化一个连续变量需要大量比特位。
相关文章
|
XML Java 数据库连接
【问题已解决】Caused by: java.lang.IllegalStateException
【问题已解决】Caused by: java.lang.IllegalStateException
390 0
|
NoSQL 安全 Java
分布式锁实现原理与最佳实践
在单体的应用开发场景中涉及并发同步时,大家往往采用Synchronized(同步)或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中,就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题,这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。
|
前端开发 JavaScript
vue3实现验证码校验的功能
最近想实现使用vue3实现一个简易的前端验证码校验的功能,就花了点时间实现了,这只是一个简易版的,但是用在项目中是没有啥问题的,废话不多说,先来看下最终实现的效果。写着玩的 哈哈
742 0
JAVA AQS 抽象队列同步器
在 AQS(AbstractQueuedSynchronizer)中,可以通过一些机制来实现共享锁。AQS是Java并发包中的一个基础框架,它提供了一种用于构建锁和同步器的工具。
【UCIe】UCIe 相关术语名词缩写释义
【UCIe】UCIe 相关术语名词缩写释义
383 0
【UCIe】UCIe 相关术语名词缩写释义
|
存储 弹性计算 编解码
【产品动态】阿里云弹性计算产品月刊-1月
阿里云推出面向转码场景的实例gn7r;轻量应用服务器实例健康诊断功能上线、导入镜像页面优化、云市场商品支持绑定计算巢服务的自定义套餐;游戏行业云资源选型与部署实践;高校学生最多免费领7个月云服务器……更多前沿云产品动态,尽在弹性计算产品月刊。
【产品动态】阿里云弹性计算产品月刊-1月
|
Dart Android开发
Flutter(十七)——组合动画
Flutter(十七)——组合动画
467 2
Flutter(十七)——组合动画
|
jenkins Java 持续交付
jenkins-CICD系列之-Jenkins 单容器发布
Jenkins 在docker容器中自动化发布构建
|
Ubuntu 网络安全 数据安全/隐私保护
|
Android开发
第五章(1)Libgdx应用框架之生命周期
生命周期 一个libgdx应用有一个良好定义的生命周期,管理应用的状态,比如创建,暂停和恢复,渲染和处理应用。 ApplicationListener 应用开发者通过实现ApplicationListener接口来调整生命周期: pu...
1111 0