算法金 | 协方差、方差、标准差、协方差矩阵

简介: **摘要:**本文介绍了统计学中的基础概念,包括方差、标准差、协方差及其矩阵。方差衡量数据的分散程度,标准差是方差的平方根,提供相同单位下的波动度量。协方差则分析两个变量的关联性,正负值表示正负相关。协方差矩阵扩展到多变量情况,展示多个变量间的关系。这些工具在金融、质量控制、机器学习等领域有广泛应用。文章通过实例和公式清晰解释了每个概念,并强调理解它们之间的关系对于数据分析和统计建模的重要性。

\

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」

1. 方差

方差是统计学中用来度量一组数据分散程度的重要指标。它反映了数据点与其均值之间的偏离程度。在数据分析和机器学习中,方差常用于描述数据集的变异情况

1.1 定义与计算方法 方差的计算方法如下:

  1. 计算数据集的均值(平均值)
  2. 计算每个数据点与均值的差值
  3. 将这些差值平方
  4. 将平方后的差值相加
  5. 将总和除以数据点的数量

方差的公式为:

1.2 实际应用 方差在许多领域都有广泛应用。例如,在金融领域,方差用来衡量投资回报率的波动性。在质量控制中,方差用来衡量生产过程的稳定性。在机器学习中,方差用于评估模型的性能和稳定性

1.3 示例

假设我们有一组数据:[1, 2, 3, 4, 5]

2. 标准差

标准差是方差的平方根,是另一种度量数据分散程度的指标。标准差与方差一样,反映了数据点与均值之间的偏离程度,但标准差的单位与数据本身一致,因此更容易解释和理解

2.1 定义与计算方法 标准差的计算方法如下:

  1. 计算数据集的均值(平均值)
  2. 计算每个数据点与均值的差值
  3. 将这些差值平方
  4. 将平方后的差值相加
  5. 将总和除以数据点的数量,得到方差
  6. 对方差取平方根,得到标准差

标准差的公式为:

2.2 实际应用 标准差广泛应用于各种领域。例如,在金融领域,标准差用来衡量投资回报率的波动性。在质量控制中,标准差用来衡量生产过程的稳定性。在统计分析和数据科学中,标准差用来描述数据集的离散程度

2.3 示例

继续前面的例子,假设我们有一组数据:[1, 2, 3, 4, 5]

防失联,进免费知识星球,直达算法金 AI 实验室 https\://t.zsxq.com/ckSu3

3. 协方差

协方差是用来衡量两个变量之间关系的一种统计指标。它表示了两个变量如何一起变化:当一个变量变大时,另一个变量是否也变大(正协方差)或变小(负协方差)。协方差的值可以是正、负或零,具体取决于变量之间的关系

3.1 定义与计算方法 协方差的计算方法如下:

  1. 计算每个变量的均值(平均值)
  2. 计算每个变量与其均值的差值
  3. 将两个变量的差值乘积求和
  4. 将和除以数据点的数量

协方差的公式为:

3.2 实际应用 协方差在许多领域都有广泛应用。例如,在金融领域,协方差用来衡量不同资产回报率之间的相关性。在经济学中,协方差用来分析不同经济指标之间的关系。在机器学习中,协方差用于特征选择和数据预处理

3.3 示例

假设我们有两个变量的数据集:𝑋=[1,2,3,4,5]𝑋=[1,2,3,4,5] 和 𝑌=[2,4,6,8,10]

4. 协方差矩阵

协方差矩阵是用于描述多个变量之间协方差关系的矩阵。它是一个对称矩阵,其中每个元素表示对应变量对之间的协方差。协方差矩阵在多变量统计分析和机器学习中起着重要作用

4.1 定义与计算方法 协方差矩阵的计算方法如下:

  1. 计算每个变量的均值(平均值)
  2. 计算每个变量与其均值的差值
  3. 计算每对变量之间的协方差
  4. 将协方差填入矩阵对应位置

协方差矩阵的公式为:

4.2 实际应用 协方差矩阵在数据分析和机器学习中有广泛的应用。例如,在主成分分析(PCA)中,协方差矩阵用于特征降维。在多变量回归分析中,协方差矩阵用于估计回归系数的标准误。在组合投资中,协方差矩阵用于分析不同资产的风险

4.3 示例

假设我们有三个变量的数据集:𝑋1=[1,2,3],𝑋2=[4,5,6],𝑋3=[7,8,9]

防失联,进免费知识星球,直达算法金 AI 实验室

https\://t.zsxq.com/ckSu3

5. 各指标之间的关系与对比

在数据分析和统计学中,方差、标准差、协方差及协方差矩阵都是衡量数据分布和变量关系的重要工具。理解它们之间的关系和区别有助于更好地应用这些工具进行分析

5.1 方差与标准差 方差和标准差都是度量数据分散程度的指标,但它们的单位和解释不同

  • 方差:方差表示数据点与均值之间的平方差的平均值,单位是数据单位的平方。方差公式为:

  • 标准差:标准差是方差的平方根,因此其单位与数据本身一致。标准差公式为:

5.2 标准差与协方差 标准差和协方差虽然都是度量数据分布和关系的指标,但它们用于不同的情景

  • 标准差:标准差用于度量单个变量的分散程度,是方差的平方根。它可以帮助我们理解单个变量的波动性
  • 协方差:协方差用于度量两个变量之间的关系,表示一个变量变化时另一个变量的变化情况。协方差公式为:

5.3 协方差与协方差矩阵 协方差和协方差矩阵都是用来描述变量之间关系的工具,但协方差矩阵可以同时描述多个变量之间的关系

  • 协方差:协方差只描述两个变量之间的关系,正值表示正相关,负值表示负相关
  • 协方差矩阵:协方差矩阵是一个对称矩阵,包含多个变量之间的协方差信息,用于多变量统计分析。协方差矩阵公式为:

[ 抱个拳,总个结 ]

- 科研为国分忧,创新与民造福 -

日更时间紧任务急,难免有疏漏之处,还请大侠海涵 内容仅供学习交流之用,部分素材来自网络,侵联删

[ 算法金,碎碎念 ]

入选 CSDN 算法领域

内容榜单 Top 1

真香~

全网同名,日更万日,让更多人享受智能乐趣

如果觉得内容有价值,烦请大侠多多 分享、在看、点赞,助力算法金又猛又持久、很黄很 BL 的日更下去;同时邀请大侠 关注、星标 算法金,围观日更万日,助你功力大增、笑傲江湖

目录
相关文章
|
6月前
|
算法 测试技术 C++
【动态规划】【矩阵快速幂】【滚动向量】C++算法552. 学生出勤记录 II
【动态规划】【矩阵快速幂】【滚动向量】C++算法552. 学生出勤记录 II
|
6月前
|
算法 Java C语言
第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-48 算法训练 关联矩阵
第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-48 算法训练 关联矩阵
66 0
|
6月前
|
算法 测试技术 C#
【动态规划】【矩阵快速幂】【滚动向量】C++算法552. 学生出勤记录 II
【动态规划】【矩阵快速幂】【滚动向量】C++算法552. 学生出勤记录 II
|
22天前
|
并行计算 算法 IDE
【灵码助力Cuda算法分析】分析共享内存的矩阵乘法优化
本文介绍了如何利用通义灵码在Visual Studio 2022中对基于CUDA的共享内存矩阵乘法优化代码进行深入分析。文章从整体程序结构入手,逐步深入到线程调度、矩阵分块、循环展开等关键细节,最后通过带入具体值的方式进一步解析复杂循环逻辑,展示了通义灵码在辅助理解和优化CUDA编程中的强大功能。
|
1月前
|
机器学习/深度学习 算法 搜索推荐
django调用矩阵分解推荐算法模型做推荐系统
django调用矩阵分解推荐算法模型做推荐系统
26 4
|
1月前
|
存储 算法
动态规划算法学习一:DP的重要知识点、矩阵连乘算法
这篇文章是关于动态规划算法中矩阵连乘问题的详解,包括问题描述、最优子结构、重叠子问题、递归方法、备忘录方法和动态规划算法设计的步骤。
101 0
|
3月前
|
算法 Java
LeetCode经典算法题:矩阵中省份数量经典题目+三角形最大周长java多种解法详解
LeetCode经典算法题:矩阵中省份数量经典题目+三角形最大周长java多种解法详解
51 6
|
4月前
|
人工智能 算法
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
**统计学江湖概要** - **平均数(均值)**:数字的总和除以数量,代表集中趋势,如分赃时平均分配。 - **众数**:出现次数最多的数字,反映了最常见的值,如同一招式被频繁使用。 - **中位数**:排序后位于中间的值,反映数据的中心位置,如同武者武功的中等水平。 - **极差**:最大值减最小值,表示数据波动范围,类似武功最高与最低的差距。 - **方差**:衡量数据波动性,计算每个数值与均值差的平方和的平均数。 - **标准差**:方差的平方根,同单位的波动度量。 - **频数**:某个值出现的次数,如统计武器使用情况。 - **频率**:频数与总次数的比例,显示出现的相对频率。
86 2
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
|
6月前
|
算法 测试技术 编译器
【算法 | 实验18】在字符矩阵中查找给定字符串的所有匹配项
题目描述 题目 在字符矩阵中查找给定字符串的所有匹配项 给定一个M×N字符矩阵,以及一个字符串S,找到在矩阵中所有可能的连续字符组成的S的次数。所谓的连续字符,是指一个字符可以和位于其上下左右,左上左下,右上右下8个方向的字符组成字符串。用回溯法求解。
96 1
|
5月前
|
算法
【经典LeetCode算法题目专栏分类】【第6期】二分查找系列:x的平方根、有效完全平方数、搜索二位矩阵、寻找旋转排序数组最小值
【经典LeetCode算法题目专栏分类】【第6期】二分查找系列:x的平方根、有效完全平方数、搜索二位矩阵、寻找旋转排序数组最小值