回归模型参数估计-3| 学习笔记

简介: 快速学习回归模型参数估计-3。

开发者学堂课程【机器学习算法 :回归模型参数估计-3】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7191


回归模型参数估计-3

 

一、参数估计:最大似然估计

最大似然估计(Maximum Likelihood Estimation ,MLE):利用总体的分布密度或概率分布的表达式及其样本所提供的信息求未知参数估计量的一种方法。

如果概率或统计学学的很好是可以看的明白的,如果不好就来慢慢体会。

最大似然估计基本思路:已知样本符合某种分布,但分布的具体参数未知,通过实验,估算分布的参数。估算的思想为:已知某组参数能使当前样本出现的概率最大,就认为该参数为最终的估计值。

举一个例子,投掷一枚已知质地并不均匀硬币,正反面的结果符合二项式分布:image.png,其中 n 和 k 为与实验相关的常数(意思是投掷n次中有k次是正面,这两个是不用求),p 为出现正面的概率(p 是变量,如果投一个硬币,硬币并不均匀,正反面的结果是符合二项分布的,会有一个方程满足二项分布),也是待确定的参数。

将该硬币投掷 i 次,出现正面次数为 j,在没有其他更多信息的情况下,则有理由相信image.png。比如投了十次出现了三次正面,这就说明此时硬币正面的概率最可能是十分之三

最大似然估计解决的是“模型已定,参数未知“(就是已经知道模型是什么样,但不知道参数,就需要根据实际的情况去估计参数。)的问题,即用已知样本的结果,去反推既定模型中的参数最可能的取值。其实上次在讲到假设检验的时候提到过一个例子,实际上那个例子是实际评查但是改成了基因病,也是根据当前出现的这个结果。就是公式中,参数取到的值,最有可能出现当前的结果,就把它作为参数的估计值。举一个例子,根据已有样本的学习,穿裙子的可能百分之九十九的可能是女生。此时,来了一个并没有看清出男女的人过来,告诉穿了裙子来判断是男是女,根据已有的信息和知识,从平时的学习、接人待物,在跟人打交道的过程中,观察发现,女的爱穿裙子,男的基本不穿,那么这个就是已知的信息。回到判断的问题上,在没有更多信息的情况下,认为是女生的概率更大,所以会把参数定义为女。这个方法是很重要的,特别是一些不适合用在最小二乘法的情况下,经常会使用最大似然估计。

出现当前情形的概率为:image.png,image.png未知,n 个随机事件都发生,竖线是条件。就是在参数为的条件下,出现image.png事件的概率等于image.pngimage.png发生的概率乘以image.pngimage.png发生的概率一直乘到image.pngimage.png发生的概率。这就称之为似然函数image.pngimage.png,其实对于似然函数Limage.png来讲是在image.png的前提下求image.png,实际上是关于image.png的一个函数。注意第一个式子能够乘是有一个前提的是事件之间是独立的。

为了方便计算,取对数,取对数是为了把乘法变为加法、把除法变为减法,把次幂变为乘法,就相当于降低了复杂程度。image.pngimage.png

平均对数似然image.png记作:image.png,最大似然估计就是找到一个image.png使得image.png最大,即:image.png,这个公式建议记住数学含义,或者直白的讲当前事件发生的概率可以用来表示,这个事件发生了,要想办法使表达的方程、概率最大就可以。因为已经发生了,比如还是刚刚判断男女的,已经知道了是女的,如果把这个是男是女按照一个方程来表示,这有一个未知数已知数据是女的,那么这个表达出来,加入求得有两个值,第一个的概率使30%,第二个概率是25%,那现在应该选择概率大的那一个才符合现实。就已知的信息,30%的值是更加靠谱的,所以选择第一个。求一个最大的平均对数参数的值来作为参数,这个对于统计学学的一般的同学、理解会比较困难。将硬币投掷10次,出现正面次数为3,有理由相信 p=0.3,这是频率中的知识。还有10投3正的概率为:image.png

P 是正面的概率,(1-p) 就是背面的概率。注意这里发生了转换,在描述的时候发生的事件是image.png,前提条件是 p,但之后似然函数的条件与事件位置发生了变化。它的似然函数为image.png。其平均对数似然为:image.pngimage.png求最大值,对image.png求导并让等于0:image.png。解出 p=0.3,因为这个例子比较简单,可以算出答案,但如果题目比较复杂,就列出式子一步一步计算。

image.png

相关文章
|
2月前
|
机器学习/深度学习 算法
贝叶斯线性回归:概率与预测建模的融合
本文探讨了贝叶斯方法在线性回归中的应用,从不确定性角度出发,介绍了如何通过概率来表达变量间关系的不确定性。文章首先回顾了古希腊天文学家使用本轮系统模拟行星运动的历史,并将其与傅里叶级数分解方法类比,强调了近似的重要性。接着,通过高斯分布和贝叶斯推断,详细讲解了线性回归中的不确定性处理方法。文章使用Howell1数据集,展示了如何构建和拟合高斯模型,并通过先验预测模拟验证模型合理性。最后,介绍了多项式回归和样条方法,展示了如何逐步增加模型复杂性以捕捉更细微的数据模式。贝叶斯方法不仅提供了点估计,还提供了完整的后验分布,使得模型更具解释性和鲁棒性。
53 1
贝叶斯线性回归:概率与预测建模的融合
|
7月前
|
算法
t-GARCH 模型的贝叶斯推断理论
t-GARCH 模型的贝叶斯推断理论
|
7月前
|
数据可视化 数据建模 大数据
MCMC的rstan贝叶斯回归模型和标准线性回归模型比较
MCMC的rstan贝叶斯回归模型和标准线性回归模型比较
|
7月前
|
机器学习/深度学习 算法 数据可视化
R语言逻辑回归和泊松回归模型对发生交通事故概率建模
R语言逻辑回归和泊松回归模型对发生交通事故概率建模
|
机器学习/深度学习 数据可视化 算法
机器学习系列6 使用Scikit-learn构建回归模型:简单线性回归、多项式回归与多元线性回归
在本文中,我们以美国南瓜数据为例,讲解了三种线性回归的原理与使用方法,探寻数据之间的相关性,并构建了6种线性回归模型。将准确率从一开始的0.04提升到0.96.
360 0
|
机器学习/深度学习 算法
线性回归模型-误差分析
线性回归模型-误差分析
174 0
|
机器学习/深度学习 算法 开发者
回归模型参数估计-5| 学习笔记
快速学习回归模型参数估计-5。
回归模型参数估计-5| 学习笔记
|
机器学习/深度学习 算法 开发者
回归模型参数估计-4| 学习笔记
快速学习回归模型参数估计-4。
回归模型参数估计-4| 学习笔记
|
机器学习/深度学习 算法 开发者
回归模型的参数估计-1| 学习笔记
快速学习回归模型的参数估计-1。
回归模型的参数估计-1| 学习笔记