一句话总结PCA

简介: 一句话总结PCA

一句话总结PCA



核心:向重构误差最小(方差最大)的方向做线性投影。



PCA是一种数据降维和去除相关性的方法,它通过线性变换将向量投影到低维空间。对向量进行投影就是让向量左乘一个矩阵得到结果向量,这是线性代数中讲述的线性变换:


y = Wx


降维要确保的是在低维空间中的投影能很好的近似表达原始向量,即重构误差最小化。下图是主分量投影示意图:


image.png


在上图中样本用红色的点表示,倾斜的直线是它们的主要变化方向。将数据投影到这条直线上即完成数据的降维,把数据从2维降为1维。计算最佳投影方向时求解的最优化问题为:

image.png



最后归结为求协方差矩阵的特征值和特征向量:


image.png


PCA是一种无监督的学习算法,它是线性模型,不能直接用于分类和回归问题。


相关文章
|
2月前
|
数据采集 机器学习/深度学习 搜索推荐
大模型开发: 描述主成分分析(PCA)以及它在降维中的应用。
PCA是广泛应用的降维技术,通过线性变换找到最大化方差的主成分,降低数据维度,简化计算并揭示数据结构。步骤包括数据预处理、计算协方差矩阵、特征值分解、选择主成分和数据转换。适用于图像识别、推荐系统等领域,但无监督性质可能导致类别信息丢失,且假设数据服从高斯分布。
|
2月前
|
数据采集 数据可视化 数据挖掘
使用R语言进行主成分分析(PCA)
【4月更文挑战第26天】本文介绍了如何使用R语言进行主成分分析(PCA),包括安装必要包`stats`、`FactoMineR`和`factoextra`,数据预处理如标准化,使用`PCA()`函数执行PCA,以及通过`summary()`、`fviz_pca_ind()`和`fviz_pca_var()`进行结果解读和可视化。此外,还讨论了如何通过载荷系数解释主成分,强调PCA在数据降维和探索数据结构中的作用。
|
2月前
|
算法 数据可视化 Python
使用Python实现主成分分析(PCA)
使用Python实现主成分分析(PCA)
79 4
|
9月前
|
数据采集 机器学习/深度学习 数据可视化
R实战| PCA、tSNE、UMAP三种降维方法在R中的实现
R实战| PCA、tSNE、UMAP三种降维方法在R中的实现
179 0
|
机器学习/深度学习 传感器 人工智能
【聚类】基于PCA+kmeans实现数据聚类附matlab代码
【聚类】基于PCA+kmeans实现数据聚类附matlab代码
|
机器学习/深度学习 数据可视化 算法
.Kmeans无监督学习主成分分析(PCA)
.Kmeans无监督学习主成分分析(PCA)
186 0
.Kmeans无监督学习主成分分析(PCA)
|
机器学习/深度学习 算法 搜索推荐
|
机器学习/深度学习 算法 数据可视化
轻松玩转 Scikit-Learn 系列 —— 你居然不知道 PCA ?
PCA 的全称是 Principal Component Analysis,翻译过来就是主成分分析法,是数据分析中常用的数据降维方法,亦是一种学习数据表示的无监督学习算法。在讨论 PCA 之前,让我们先考虑下机器学习中的数据。
243 0
轻松玩转 Scikit-Learn 系列 —— 你居然不知道 PCA ?
|
机器学习/深度学习 算法 计算机视觉