SPSS两变量相关性分析

简介: SPSS两变量相关性分析

1.两变量相关性分析

两变量相关性分析是统计学中用于评估两个变量之间是否存在线性关系以及关系紧密程度的一种方法。相关性的大小通常使用相关系数来衡量,最常用的是皮尔逊相关系数(Pearson correlation coefficient),但还有斯皮尔曼等级相关系数(Spearman’s rank correlation coefficient)和肯德尔等级相关系数(Kendall’s tau coefficient)等其他方法。

1.1 皮尔逊相关系数(Pearson Correlation Coefficient)

皮尔逊相关系数用于度量两个连续变量之间的线性相关性。其取值范围是从-1到1,其中1表示完全正相关,-1表示完全负相关,0表示没有线性相关。

相关系数公式为:

image.png

1.2 斯皮尔曼等级相关系数(Spearman’s Rank Correlation Coefficient)

斯皮尔曼相关系数用于度量两个变量的等级(或顺序)之间的相关性。这适用于定序(ordinal)数据或不完全符合正态分布的连续数据。

斯皮尔曼相关系数的公式为:

image.png

这里,( d_i ) 是两个变量的等级之差,( n ) 是数据点的数量。

1.3 肯德尔等级相关系数(Kendall’s Tau Coefficient)

肯德尔等级相关系数是另一种非参数统计方法,用于度量两个变量之间的相关性。它通过比较数据对中的协调和不协调对的数量来计算。

肯德尔τ \tauτ的计算稍微复杂一些,其公式为:

image.png

这里,C 表示协调对,D 表示不协调对,T 是变量X的绑定对的数量,U 是变量Y的绑定对的数量。

2.SPSS实现

(1)打开“data08-01”数据文件,选择“分析”——“相关”——“双变量”,弹出下图所示的对话框。

(2)将左侧“价格”和“马力”变量移到右侧,然后按照下图所示勾选对应选项。

(3)单击“选项”按钮,弹出“双变量相关性:选项”对话框,按照下图所示勾选对应选项。

(4)完成所有设置后,单击确定。

3.结果分析

目录
相关文章
|
6月前
定类变量的频率分析(SPSS
定类变量的频率分析(SPSS
69 0
|
6月前
|
数据可视化
R语言生态学进化树推断物种分化历史:分类单元数与时间关系、支系图可视化
R语言生态学进化树推断物种分化历史:分类单元数与时间关系、支系图可视化
R语言生态学进化树推断物种分化历史:分类单元数与时间关系、支系图可视化
|
6月前
R语言单位根、协整关系Granger因果检验、RESET分析汇率在岸和离岸数据时间序列
R语言单位根、协整关系Granger因果检验、RESET分析汇率在岸和离岸数据时间序列
|
6月前
stata对包含协变量的模型进行缺失值多重插补分析
stata对包含协变量的模型进行缺失值多重插补分析
|
6月前
R语言分析协变量之间的非线性关系
R语言分析协变量之间的非线性关系
|
6月前
|
机器学习/深度学习
R语言使用 LOWESS技术图分析逻辑回归中的函数形式
R语言使用 LOWESS技术图分析逻辑回归中的函数形式
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归分析连续变量和分类变量之间的“相关性“
R语言逻辑回归分析连续变量和分类变量之间的“相关性“
|
6月前
R语言工具变量与两阶段最小二乘法
R语言工具变量与两阶段最小二乘法
|
6月前
|
数据可视化
R语言广义相加模型 (GAMs)分析预测CO2时间序列数据
R语言广义相加模型 (GAMs)分析预测CO2时间序列数据
|
算法
基于有序模式的度量对多变量时间序列进行非线性分析研究(Matlab代码实现)
基于有序模式的度量对多变量时间序列进行非线性分析研究(Matlab代码实现)
134 0