概率密度函数(Probability Density Function,简称 PDF)是在概率论和统计学中用来描述随机变量的概率分布的函数。对于连续型随机变量,概率密度函数表示在某一点附近的概率密度。
概率密度函数在统计学中的应用非常广泛,特别是在描述和分析连续型随机变量时。常见的概率密度函数包括正态分布、均匀分布、指数分布等。这些函数在建模实际问题、进行假设检验和推断等方面发挥着重要的作用。
最常见的连续概率分布是正态分布,也叫高斯分布,而这正是我们所需要的,其概率密度函数如下:
公式如下:
随着参数μ和σ变化,概率分布也产生变化。 下面重要的步骤来了,我们要把一组数据误差出现的总似然,也就是一组数据之所以对应误差出现的整体可能性表达出来了,因为数据的误差我们假设服从一个高斯分布,并且通过截距项来平移整体分布的位置从而使得μ=0,所以样本的误差我们可以表达其概率密度函数的值如下:
简化如下:
3.5、误差总似然
和前面黑球白球问题类似,也是一个累乘问题~
根据前面公式$\varepsilon_i = |y_i - W^Tx_i|$可以推导出来如下公式:
公式中的未知变量就是$W^T$,即方程的系数,系数包含截距~如果,把上面当成一个方程,就是概率P关于W的方程!其余符号,都是常量!
现在问题,就变换成了,求最大似然问题了!不过,等等~
累乘的最大似然,求解是非常麻烦的!
接下来,我们通过,求对数把累乘问题,转变为累加问题(加法问题,无论多复杂,都难不倒我了!)