Pandas 相关系数与协方差
有些汇总统计(如相关系数和协方差)是通过参数对计算出来的。
1. Series的 corr 方法用于计算两个 Series 中重叠的、非 NA 的,按索引对齐的值的相关系数。 cov 用于计算协方差。
2. DataFrame 的 corr 和 cov 方法将以 DataFrame 的形式返回完整的相关系数或协方差矩阵。
3. 利用 DataFrame 的 corrwith 方法,可以计算其列或行跟另一个 Series 或 DataFrame 之间的相关系数。
1)传入一个 Series 将会返回一个相关系数值 Series(针对各列进行计算)
2)传入一个 DataFrame 会计算按列名配对的相关系数。
以上整理自《利用 Python 进行数据分析》。