【机器学习】面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？PCA与线性判别分析LDA降维的区别？-阿里云开发者社区

【机器学习】面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？PCA与线性判别分析LDA降维的区别？

2024-08-06 977

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍了主成分分析(PCA)算法，包括PCA的基本概念、算法过程、中心化处理的必要性、正交变换的目的，以及PCA与线性判别分析(LDA)在降维上的区别。

面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？

（1）简单介绍一下PCA

主成分分析(Principal componet analysis,PCA) 是一种无监督学习方法，利用正交变换把线性相关变量表示的观测数据转换为几个由线性无关变量表示的数据，线性无关的变量成为主成分。主成分的个数通常小于原始变量的个数，属于降维方法。根据分解协方差矩阵的策略，分为两种PCA方法，第一种是基于特征值分解协方差矩阵实现PCA算法，第二种是基于奇异值分解法(SVD)分解协方差矩阵实现PCA算法。

（2）PCA的算法过程

对样本数据中心化处理
求样本协方差矩阵
对协方差矩阵进行特征值分解，将特征值从大到小排列
取特征值前d大的特征向量$w1,w2,...,wd$，通过以下映射将n维样本映射到d维度。

$$X_i^{’} = [w_1^Tx_i,w_2^Tx_i,...,w_d^Tx_i]^T$$

其中协方差分解，具体查看博客PCA 主成分分析算法过程及原理讲解
（3）PCA为什么要中心化

把坐标原点放在数据的中心，找方差最大的方向，如果不放在中心，坐标原点就是数据的旁边，映射不到坐标上。

具体讲解看视频解析：B站讲解PCA

（4）PCA的主成分是什么

主成分分析(Principal componet analysis,PCA) 是一种无监督学习方法，利用正交变换把线性相关变量表示的观测数据转换为几个由线性无关变量表示的数据，线性无关的变量称为主成分。

（5）PCA 中为什么要做正交变换？

PCA 的思想是将 n 维特征映射到 d 维上（d<n），这 d 维是全新的正交特征。这 d维特征称为主成分，是重新构造出来的 d 维特征，而不是简单地从 n 维特征中去除其余 n-d维特征。PCA 的目的是选择更少的主成分，那些选上的主成分能够解释数据集中最大方差。通过正交变换，各主成分的相对位置不发生变化，它只能改变点的实际坐标。
（６）PCA与线性判别分析LDA降维的区别？

PCA是非监督的学习算法，LDA是有监督的学习算法，考虑了类别标签
PCA选择的是投影后数据方差最大的方向。PCA假设方差越大，信息量越大，用主成分来表示原始数据可以去除冗余的维度，达到降维。LDA选择的是投影后类内方差小，类间方差大的方向，用到了类别标签信息，为了找到数据中具有判别性的维度，使得原始数据在这些方向上投影后，不同类别尽可能区分开。

【机器学习】面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？PCA与线性判别分析LDA降维的区别？

面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【机器学习】面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？PCA与线性判别分析LDA降维的区别？

面试问答：PCA算法介绍？PCA算法过程？PCA为什么要中心化处理？PCA为什么要做正交变化？

热门文章

最新文章

相关课程

相关电子书

相关实验场景