程序技术好文:概率论与数理统计图式(第三章多维随机变量)

简介: 程序技术好文:概率论与数理统计图式(第三章多维随机变量)

概率论与数理统计图式(第三章 多维随机变量)


1、二位随机变量及其分布


1)二维随机变量定义


设随机试验E 的样本空间//代码效果参考:http://www.lyjsj.net.cn/wz/art_24117.html

为Ω,对于每一样本点ω∈Ω ,有两个实数 X (Ω), Y (Ω) 与之对应,称它们构成的有序数组 ( X , Y ) 为 二维随机变量。

注:对二维随机变量( X, Y )来说, X,Y 都是定义在Ω上的一维随机变量.


随机事件事件——>随机变量的取值范围,x:{X<=x},Fx(x)


2)联合分布函数


(1)联合分布函数几何意义


平面随机点( X, Y ) 落入以(x, y)为顶点的左下方区域的概率。


(2)联合分布函数的性质


单调不减性


非负有界性


右连续性


相容性  


3)边缘分布函数


(1)定义:称X、Y各自的分布函数 FX(x) 与 FY(y) 为( X, Y ) 的边缘分布函数。


(2)由联合分布函数可确定边缘分布函数:


2、联合分布律


用边缘分布律不一定能确定联合分布律!


原因:多维随机变量的联合分布不仅与每个变量的边缘分布有关,而且还与每个变量之间的联系有关!两个随机变量X,Y不等同于二维随机变量(X,Y)!


3、联合概率密度


(1)联合概率密度的物理解释:概率在(x, y)处的面密度.


(2)联合概率密度曲面


(3)f(x)满足


非负性和规范性


对边缘概率密度的求解,就是固定y对x求积分,实质上是求带参变量的积分。


难点: 积分上下限的确定!——对于 y 取不同的值,f Y ( y )的积分上下限是不相同的。


可通过图形来帮助解决这个问题。


4、二维均匀分布


1)记为(X,Y)~U(G)


5、二维正态分布


1)二元正态分布,不用背公式,要记参数。


2)记为,σ1,σ2>0,|ρ|<1


3) 边缘分布相关


二维正态分布的边缘分布还是正态分布


边缘分布都是正态分布,其联合分布却未必是正态分布


边缘分布函数不能推导联合分布函数,因为缺少参数ρ,若ρ=0(x,y相互独立)可推


6、随机变量的独立性


1)二维随机变//代码效果参考:http://www.lyjsj.net.cn/wz/art_24115.html

量独立性

  1》定义: ( X , Y )是二维随机变量, 若对任意实数对( x , y )均有成立,称 X与Y相互独立


  2》对随机变量相互独立的理解:随机变量X与Y的取值互相之间没有影响;随机事件{ X ≤ x }与随机 事件{ Y ≤ y } 相互独立。随机变量的独立性本质上是事件的独立性


  3》随机变量相互独立的等价条件:


2)多维随机变量独立性


  1》定理:若n维随机变量(X1 ,X2,…,Xn ) 相互独立,则


随机变量 g1(X1), g2(X2),…, gn(Xn) 也相互独立.


随机变量 h (X1 ,X2,…,Xm ) 与g(Xm+1 ,Xm+2,…,Xn ) 也相互独立.


  2》若要判断不相互独立,则只需找到一组a, b使定义式不成立即可。


7、条件分布


1)条件分布律


在X=xi的条件下,随机变量Y 的条件分布律:


2)条件概率密度


  1》在随机变量Y= y 的条件下, 考虑随机变量X 的条件分布函数为


  2》由于不能保证 P {Y=y }> 0,所以在一般情况下, 不能用条件概率的定义来直接定义条件分布函数。这时需采用极限的方法来定义条件分布函数。


    1>Y=y的条件下,随机变量X 的条件分布函数.记作 FX|Y(x |y)


    2>结论: 设(X,Y)是连续型随机变量, 且满足f (x, y), fY ( y) 在(x, y)附近连续, 且 fY ( y) > 0 则有


  //代码效果参考:http://www.lyjsj.net.cn/wz/art_24113.html

3》条件概率密度

4》如何判断两个连续型随机变量X,Y 相互独立


5》联合分布、边缘分布、条件分布三者之间的关系   


一个条件分布和相应的边缘分布能唯一确定联合分布.


6》分布联系


  二维均匀分布的条件分布还是均匀分布;


  二维正态分布的条件分布还是正态分布;


8、随机变量的函数及其分布


1)以随机变量为自变量的函数。


2)离散型随机变量的函数及其分布律


  1》离散型随机变量分布律


  2》可加性


二项分布具有可加性


结论: 二项分布随机变量可等价表示为多个独立0-1分布随机变量之和!


泊松分布具有可加性


3)连续型随机变量的函数及其概率密度


  1》连续型随机变量的函数及其概率密度的定理


分布函数法


反函数法


4)例题

相关文章
|
5月前
|
机器学习/深度学习 算法 前端开发
“当树木集结成林:解密决策树与随机森林的神秘面纱,探寻数据背后的自然法则”
【10月更文挑战第11天】决策树与随机森林是机器学习中常用的监督学习算法,适用于分类和回归任务。决策树通过树形结构进行决策,每个节点代表一个属性测试,每个叶节点代表一个类别。随机森林通过集成多棵决策树,采用自助采样和特征随机选择,提高模型的准确性和鲁棒性。示例代码展示了如何使用Python和scikit-learn构建这两种模型,并评估其性能。
68 3
|
9月前
|
算法 数据挖掘 计算机视觉
程序技术好文:聚类算法一(Kmeans、层次类聚、谱类聚)
程序技术好文:聚类算法一(Kmeans、层次类聚、谱类聚)
61 0
|
9月前
|
BI 编译器
心得经验总结:概率论与数理统计复习
心得经验总结:概率论与数理统计复习
63 0
|
9月前
程序技术好文:高等代数第3讲——n阶行列式
程序技术好文:高等代数第3讲——n阶行列式
57 0
|
9月前
|
算法
程序技术好文:香农熵学习+例子【转载】
程序技术好文:香农熵学习+例子【转载】
57 0
|
10月前
|
算法 数据可视化 测试技术
【软件设计师备考 专题 】概率论与统计学:理解数据的统计分析
【软件设计师备考 专题 】概率论与统计学:理解数据的统计分析
131 0
|
机器学习/深度学习 数据采集
揭秘乳腺癌预测黑科技:R语言和支持向量机的奇妙之旅!
本文旨在探讨乳腺癌预测的重要性和挑战。首先,我们描述了乳腺癌作为全球常见癌症的背景和重要性。随后,我们引入了乳腺癌预测的重要性,并强调了早期检测和准确预测对于提高患者生存率的重要性。然而,乳腺癌预测面临着多方面的挑战,包括乳腺癌复杂的发病机制、数据获取和处理的困难,以及模型选择和解释的问题。为了克服这些挑战,我们需要深入研究乳腺癌预测领域,并不断改进和优化预测方法和技术。通过准确的乳腺癌预测,我们可以提供更有效的医疗护理,为患者提供更好的预防和治疗策略。
259 0
|
机器学习/深度学习 数据采集 算法
乳腺癌预测的黑科技!一起探索 R 语言和随机森林算法的奇妙之处!
本文旨在综述R语言和随机森林算法在乳腺癌研究中的应用,探讨其在乳腺癌预测、诊断和个性化治疗中的作用。通过对相关文献和实例的分析,该研究将提供关于使用R语言和随机森林算法改进乳腺癌研究的新见解,并对未来的发展方向和挑战进行讨论。
278 0
|
人工智能 资源调度 Python
概率论基础
因为概率图模型会涉及大量概率论的知识,所以在开始概率图模型之前,首先让我们回顾一下概率论的一些概念和基础知识。
180 0
概率论基础
深度之眼(二十一)——概率论
深度之眼(二十一)——概率论
103 0
深度之眼(二十一)——概率论