开发者社区 问答 正文

PCA适用哪些场景?

PCA适用哪些场景?

展开
收起
鲁花花生油 2021-11-03 15:05:27 2066 分享 版权
来自: 华章出版社
1 条回答
写回答
取消 提交回答
  • 非监督式类型的数据集。它是一种非监督式的降维方法,因此适用于不带有标签的数据集;而对于带有标签的数据集则可以采用LDA。

    根据方差自主控制特征数量。最大的主成分的数量≤特征的数量,这意味着,PCA也可以输出数量完全相同的特征,具体取决于选择特征中解释的方差比例。

    更少的正则化处理。选择较多的主成分将导致较少的平滑,因为我们将能够保留更多的数据特征,从而减少正则化。

    数据量较大的数据集。数据量大包括数据记录多和数据维度多两种情况,PCA对大型数据集的处理效率较高。

    数据分布是位于相同平面上(非曲面),数据中存在线性结构。

    资料来源:《Python数据分析与数据化运营(第2版)》,文章链接:https://developer.aliyun.com/article/726313

    2021-11-03 15:20:20
    赞同 展开评论
问答地址: