单变量和多变量高斯分布:可视化理解(下)

简介: 单变量和多变量高斯分布:可视化理解
改变标准差

640.png

图6

现在,让我们看看如果sigma变小一点会发生什么。x1 x2的sigma都是0.6。

正如我之前提到的,曲线下的面积要积分为1。标准差减小时,曲线范围减小。同时,曲线的高度变高,以调整区域。

640.png

图7

相反,当sigma越大,范围就越大。所以曲线的高度变低了。

看看图6,曲线和范围的高度变化几乎与我之前在单变量高斯分布中显示的图相似。

x1和x2的值并不总是相同的。我们来看看这样的例子。

640.png

图7

在图7中,x1的sigma = 0.6, x2的sigma = 1。

x1的范围变小了,因为标准差变小了。

640.png

图8

在图8中,它与前一张图相反。

x1的sigma是x2的两倍。

这次x1有更大的范围。

改变变量之间的相关因素

640.png

图9

这是一个完全不同的场景。在图9中,非对角线值不再是零。而是0.5。它表明x1和x2的相关系数为0.5。

x1和x2的范围是一起增长的因为它们是正相关的。

当x1大时,x2也大当x1小时,x2也小。

640.png

图10

在图10中,x1和x2之间的相关性更大,为0.8!

所有的概率都在一个狭窄的区域内。分布也看起来又高又瘦。

在上面所有的图片中,x1和x2之间的相关性要么是正的,要么是零。让我们看一个相关系数为负的例子。

640.png

图11

在图11中,x1和x2的相关性为-0.8。

你可以看到概率又在一个小范围内了。但是当x1大,x2小,当x1小,x2大。

最后,我们需要检验不同均值

我们来看看mu不同时图像的变化。

640.png

图12

在图12中,mu对于x1是0,对于x2是0。5。

看看图片上的范围。对于x2,曲线的中心从0开始移动。

中心位置或最高概率分布点现在应该是0.5。

   

640.png

图13

在图13中,mu对于x1 为1.5,对于x2 mu为-0.5。

x1方向上最高概率点是1.5。同时,对于x2方向,最高概率点为-0.5。

总的来说,整个曲线都在移动。

结论

我希望这篇文章对理解高斯分布和它的特征有帮助。我试图展示和解释曲线与不同参数之间的关系。希望,当你在统计或机器学习中使用高斯分布时,会简单得多。

目录
相关文章
|
4月前
|
机器学习/深度学习 数据处理 Python
深入理解双变量(二元)正态投影:理论基础、直观解释与应用实例
本文探讨了统计学与机器学习中的二元投影技术,它基于二元正态分布,用于预测一个变量在给定另一变量值时的期望值。文章分为三部分:首先介绍了二元正态投影的基本公式及其在回归中的应用;接着通过直观解释和模拟展示了不同相关性下变量间的关系;最后运用投影公式推导出线性回归的参数估计,并通过实例说明其在预测房屋价格等场景中的应用。附录中详细推导了二元线性投影的过程。二元投影作为一种强大工具,在数据分析中帮助简化复杂问题并揭示数据背后的规律。
58 1
深入理解双变量(二元)正态投影:理论基础、直观解释与应用实例
|
6月前
|
机器学习/深度学习 算法 数据可视化
[04-00]单变量线性回归问题
[04-00]单变量线性回归问题
|
7月前
|
机器学习/深度学习 大数据
stata如何处理结构方程模型(SEM)中具有缺失值的协变量
stata如何处理结构方程模型(SEM)中具有缺失值的协变量
|
7月前
stata对包含协变量的模型进行缺失值多重插补分析
stata对包含协变量的模型进行缺失值多重插补分析
|
7月前
R语言分析协变量之间的非线性关系
R语言分析协变量之间的非线性关系
|
7月前
R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用
R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用
|
数据挖掘
12 正态分布的定义
12 正态分布的定义
75 0
第4章 MATLAB编程基础——4.2 变量
第4章 MATLAB编程基础——4.2 变量
|
机器学习/深度学习 Linux Python
如何知道一个变量的分布是否为高斯分布?
如何知道一个变量的分布是否为高斯分布?
199 0
如何知道一个变量的分布是否为高斯分布?